MayaFlux/GpuDispatchCore_8cpp_source.html

#include "GpuDispatchCore.hpp"


#include "MayaFlux/Core/Backends/Graphics/Vulkan/VKImage.hpp"


namespace MayaFlux::Yantra {


GpuDispatchCore::GpuDispatchCore(GpuComputeConfig config)

    : m_gpu_config(std::move(config))

{

    update_dispatch_key_cache();

}


//==============================================================================

// Public interface

//==============================================================================


void GpuDispatchCore::set_push_constants(const void* data, size_t bytes)

{

    m_push_constants.resize(bytes);

    std::memcpy(m_push_constants.data(), data, bytes);

}


void GpuDispatchCore::set_output_size(size_t index, size_t byte_size)

{

    if (index >= m_output_size_overrides.size())

        m_output_size_overrides.resize(index + 1, 0);

    m_output_size_overrides[index] = byte_size;

}


bool GpuDispatchCore::ensure_gpu_ready()

{

    if (m_resources.is_ready(dispatch_key()))

        return true;

    m_bindings = declare_buffer_bindings();

    return m_resources.initialise(dispatch_key(), m_gpu_config, m_bindings);

}


bool GpuDispatchCore::is_gpu_ready() const

{

    return m_resources.is_ready(dispatch_key());

}


std::shared_ptr<Core::VKImage> GpuDispatchCore::get_output_image(size_t binding_index) const

{

    if (binding_index >= m_image_bindings.size())

        return nullptr;

    return m_image_bindings[binding_index].image;

}


const GpuComputeConfig& GpuDispatchCore::gpu_config() const

{

    return m_gpu_config;

}


//==============================================================================

// Protected staging helpers

//==============================================================================


void GpuDispatchCore::stage_passthrough(size_t binding_index, const void* data, size_t byte_size)

{

    if (binding_index >= m_passthrough_bytes.size())

        m_passthrough_bytes.resize(binding_index + 1);

    auto& slot = m_passthrough_bytes[binding_index];

    slot.resize(byte_size);

    std::memcpy(slot.data(), data, byte_size);

}


void GpuDispatchCore::stage_image_at(size_t binding_index,

    std::shared_ptr<Core::VKImage> image,

    GpuBufferBinding::ElementType kind,

    vk::Sampler sampler)

{

    if (binding_index >= m_image_bindings.size())

        m_image_bindings.resize(binding_index + 1);

    m_image_bindings[binding_index] = {

        .image = std::move(image),

        .sampler = (kind == GpuBufferBinding::ElementType::IMAGE_SAMPLED) ? sampler : nullptr,

        .kind = kind,

    };

}


void GpuDispatchCore::stage_native_bytes(size_t binding_index, const void* data, size_t byte_size)

{

    if (binding_index >= m_native_staging_bytes.size())

        m_native_staging_bytes.resize(binding_index + 1);


    m_native_staging_bytes.resize(byte_size);

    std::memcpy(m_native_staging_bytes.data(), data, byte_size);

}


//==============================================================================

// Virtual override points

//==============================================================================


std::vector<GpuBufferBinding> GpuDispatchCore::declare_buffer_bindings() const

{

    return {

        { .set = 0, .binding = 0, .direction = GpuBufferBinding::Direction::INPUT, .element_type = GpuBufferBinding::ElementType::FLOAT32 },

        { .set = 0, .binding = 1, .direction = GpuBufferBinding::Direction::OUTPUT, .element_type = GpuBufferBinding::ElementType::FLOAT32 },

    };

}


void GpuDispatchCore::on_before_gpu_dispatch(

    const std::vector<std::vector<double>>&,

    const DataStructureInfo&)

{

}


void GpuDispatchCore::prepare_gpu_inputs(

    const std::vector<std::vector<double>>& channels,

    const DataStructureInfo& structure_info)

{

    const auto& key = dispatch_key();


    flatten_channels_to_staging(channels, structure_info);

    const size_t float_byte_size = m_staging_floats.size() * sizeof(float);


    const size_t fallback_bytes = float_byte_size > 0

        ? float_byte_size

        : Kakshya::ContainerDataStructure::get_total_elements(structure_info.dimensions) * sizeof(float);


    for (auto b : m_bindings) {

        const size_t idx = b.binding;


        if (idx < m_binding_data.size() && !m_binding_data[idx].empty()) {

            m_resources.ensure_buffer(key, idx, m_binding_data[idx].size());

            m_resources.upload_raw(key, idx, m_binding_data[idx].data(), m_binding_data[idx].size());

            continue;

        }


        if (b.direction == GpuBufferBinding::Direction::OUTPUT) {

            const auto et = b.element_type;

            if (et == GpuBufferBinding::ElementType::IMAGE_STORAGE

                || et == GpuBufferBinding::ElementType::IMAGE_SAMPLED) {

            } else {

                const size_t sz = (idx < m_output_size_overrides.size() && m_output_size_overrides[idx] > 0)

                    ? m_output_size_overrides[idx]

                    : fallback_bytes;

                m_resources.ensure_buffer(key, idx, sz);

                if (idx < m_output_size_overrides.size() && m_output_size_overrides[idx] > 0) {

                    std::vector<uint8_t> zeros(sz, 0);

                    m_resources.upload_raw(key, idx, zeros.data(), sz);

                }

                continue;

            }

        }


        switch (b.element_type) {

        case GpuBufferBinding::ElementType::PASSTHROUGH:

            if (idx < m_passthrough_bytes.size() && !m_passthrough_bytes[idx].empty()) {

                m_resources.ensure_buffer(key, idx, m_passthrough_bytes[idx].size());

                m_resources.upload_raw(key, idx, m_passthrough_bytes[idx].data(),

                    m_passthrough_bytes[idx].size());

            }

            break;


        case GpuBufferBinding::ElementType::IMAGE_STORAGE: {

            if (idx >= m_image_bindings.size() || !m_image_bindings[idx].image)

                continue;

            auto& img = m_image_bindings[idx].image;

            if (img->get_current_layout() != vk::ImageLayout::eGeneral) {

                m_resources.transition_image(img, img->get_current_layout(),

                    vk::ImageLayout::eGeneral);

            }

            m_resources.bind_image_storage(key, idx, img, b);

        } break;


        case GpuBufferBinding::ElementType::IMAGE_SAMPLED: {

            if (idx >= m_image_bindings.size() || !m_image_bindings[idx].image)

                continue;

            auto& img = m_image_bindings[idx].image;

            auto sampler = m_image_bindings[idx].sampler;

            if (img->get_current_layout() != vk::ImageLayout::eShaderReadOnlyOptimal) {

                m_resources.transition_image(img, img->get_current_layout(),

                    vk::ImageLayout::eShaderReadOnlyOptimal);

            }

            m_resources.bind_image_sampled(key, idx, img, sampler, b);

        } break;


        case GpuBufferBinding::ElementType::UINT32:

        case GpuBufferBinding::ElementType::INT32:

            if (!channels.empty()) {

                const size_t raw_bytes = channels[0].size()

                    * (b.element_type == GpuBufferBinding::ElementType::UINT32

                            ? sizeof(uint32_t)

                            : sizeof(int32_t));

                m_resources.ensure_buffer(key, idx, raw_bytes);

                m_resources.upload_raw(key, idx,

                    reinterpret_cast<const uint8_t*>(channels[0].data()),

                    raw_bytes);

            }

            break;


        case GpuBufferBinding::ElementType::FLOAT32:

        default:

            if (!m_native_staging_bytes.empty()) {

                m_resources.ensure_buffer(key, idx, m_native_staging_bytes.size());

                m_resources.upload_raw(key, idx, m_native_staging_bytes.data(), m_native_staging_bytes.size());

            } else {

                m_resources.ensure_buffer(key, idx, float_byte_size);

                m_resources.upload(key, idx, m_staging_floats.data(), float_byte_size);

            }

            break;

        }

    }

}


std::array<uint32_t, 3> GpuDispatchCore::calculate_dispatch_size(

    size_t total_elements, const DataStructureInfo& structure_info) const

{

    uint64_t sz_x = 0, sz_y = 0, sz_z = 0;

    for (const auto& dim : structure_info.dimensions) {

        switch (dim.role) {

        case Kakshya::DataDimension::Role::SPATIAL_X:

            sz_x = dim.size;

            break;

        case Kakshya::DataDimension::Role::SPATIAL_Y:

            sz_y = dim.size;

            break;

        case Kakshya::DataDimension::Role::SPATIAL_Z:

            sz_z = dim.size;

            break;

        default:

            break;

        }

    }


    const auto& ws = m_gpu_config.workgroup_size;

    if (sz_x > 0) {

        return {

            static_cast<uint32_t>((sz_x + ws[0] - 1) / ws[0]),

            sz_y > 0 ? static_cast<uint32_t>((sz_y + ws[1] - 1) / ws[1]) : 1U,

            sz_z > 0 ? static_cast<uint32_t>((sz_z + ws[2] - 1) / ws[2]) : 1U,

        };

    }


    return { static_cast<uint32_t>((total_elements + ws[0] - 1) / ws[0]), 1U, 1U };

}


//==============================================================================

// Dispatch

//==============================================================================


GpuChannelResult GpuDispatchCore::dispatch_core(

    const std::vector<std::vector<double>>& channels,

    const DataStructureInfo& structure_info)

{

    on_before_gpu_dispatch(channels, structure_info);

    prepare_gpu_inputs(channels, structure_info);


    bind_all_descriptors();


    const size_t effective = m_staging_floats.empty()

        ? largest_binding_data_element_count()

        : m_staging_floats.size();

    const auto groups = calculate_dispatch_size(effective, structure_info);


    m_resources.dispatch(

        dispatch_key(), groups, m_bindings,

        m_push_constants.empty() ? nullptr : m_push_constants.data(),

        m_push_constants.size());


    GpuChannelResult result;

    result.primary = readback_primary(effective);

    readback_aux(result);

    return result;

}


GpuChannelResult GpuDispatchCore::dispatch_core_chained(

    const std::vector<std::vector<double>>& channels,

    const DataStructureInfo& structure_info,

    const ExecutionContext& ctx)

{

    on_before_gpu_dispatch(channels, structure_info);

    prepare_gpu_inputs(channels, structure_info);


    bind_all_descriptors();


    const size_t effective = m_staging_floats.empty()

        ? largest_binding_data_element_count()

        : m_staging_floats.size();

    const auto groups = calculate_dispatch_size(effective, structure_info);


    m_resources.dispatch_batched(

        dispatch_key(), groups, m_bindings,

        m_gpu_config.push_constant_size, ctx);


    GpuChannelResult result;

    result.primary = readback_primary(effective);

    readback_aux(result);

    return result;

}


GpuChannelResult GpuDispatchCore::dispatch_core_chained_indirect(

    const std::vector<std::vector<double>>& channels,

    const DataStructureInfo& structure_info,

    const ExecutionContext& ctx)

{

    on_before_gpu_dispatch(channels, structure_info);

    prepare_gpu_inputs(channels, structure_info);


    m_bindings = declare_buffer_bindings();

    if (!ensure_gpu_ready()) {

        error<std::runtime_error>(Journal::Component::Yantra,

            Journal::Context::BufferProcessing,

            std::source_location::current(),

            "GpuDispatchCore: dispatch_core_chained_indirect GPU initialisation failed");

    }


    bind_all_descriptors();


    const size_t effective = m_staging_floats.empty()

        ? largest_binding_data_element_count()

        : m_staging_floats.size();

    const auto groups = calculate_dispatch_size(effective, structure_info);


    const auto indirect_it = std::ranges::find_if(m_bindings, [](const auto& b) {

        return b.usage_hint == Portal::Graphics::BufferUsageHint::INDIRECT;

    });

    if (indirect_it == m_bindings.end()) {

        error<std::runtime_error>(Journal::Component::Yantra, Journal::Context::Runtime,

            std::source_location::current(),

            "GpuDispatchCore: dispatch_core_chained_indirect requires a binding with usage_hint INDIRECT");

    }


    m_resources.dispatch_batched_indirect(

        dispatch_key(), indirect_it->set, indirect_it->binding, groups, m_bindings,

        m_gpu_config.push_constant_size, ctx);


    GpuChannelResult result;

    result.primary = readback_primary(effective);

    readback_aux(result);

    return result;

}


Portal::Graphics::FenceID GpuDispatchCore::dispatch_core_async(

    const std::vector<std::vector<double>>& channels,

    const DataStructureInfo& structure_info)

{

    on_before_gpu_dispatch(channels, structure_info);

    prepare_gpu_inputs(channels, structure_info);


    bind_all_descriptors();


    const size_t effective = m_staging_floats.empty()

        ? largest_binding_data_element_count()

        : m_staging_floats.size();

    const auto groups = calculate_dispatch_size(effective, structure_info);


    m_last_effective_element_count = effective;


    return m_resources.dispatch_async(

        dispatch_key(), groups, m_bindings,

        m_push_constants.empty() ? nullptr : m_push_constants.data(),

        m_push_constants.size());

}


void GpuDispatchCore::dispatch_core_dependency(const std::vector<DependencyStage>& stages)

{

    const GpuComputeConfig original_config = m_gpu_config;

    const auto original_bindings = m_bindings;

    const auto original_image_bindings = m_image_bindings;

    const auto original_binding_data = m_binding_data;

    const auto original_passthrough_bytes = m_passthrough_bytes;

    const auto original_push_constants = m_push_constants;


    std::vector<std::string> keys;

    std::vector<std::array<uint32_t, 3>> groups_per_key;

    std::vector<std::vector<uint8_t>> pc_per_key;

    std::vector<std::vector<Portal::Graphics::HazardResource>> hazards_per_key;


    keys.reserve(stages.size());

    groups_per_key.reserve(stages.size());

    pc_per_key.reserve(stages.size());

    hazards_per_key.reserve(stages.size());


    for (const auto& stage : stages) {

        m_gpu_config = stage.config;

        update_dispatch_key_cache();

        m_bindings = declare_buffer_bindings();

        m_image_bindings.clear();

        m_binding_data.clear();

        m_passthrough_bytes.clear();

        m_push_constants.clear();


        stage.stage_fn(*this);


        if (!ensure_gpu_ready()) {

            error<std::runtime_error>(Journal::Component::Yantra,

                Journal::Context::BufferProcessing,

                std::source_location::current(),

                "GpuDispatchCore: dispatch_core_dependency failed to initialise key '{}'",

                stage.config.shader_path);

        }


        prepare_gpu_inputs({}, {});


        bind_all_descriptors();


        keys.push_back(dispatch_key());

        groups_per_key.push_back(stage.explicit_groups ? *stage.explicit_groups : calculate_dispatch_size(largest_binding_data_element_count(), {}));

        pc_per_key.push_back(m_push_constants);

        hazards_per_key.push_back(stage.hazard_fn ? stage.hazard_fn(*this) : std::vector<Portal::Graphics::HazardResource> {});

    }


    m_resources.dispatch_sequence(keys, groups_per_key, pc_per_key, hazards_per_key);


    m_gpu_config = original_config;

    update_dispatch_key_cache();

    m_bindings = original_bindings;

    m_image_bindings = original_image_bindings;

    m_binding_data = original_binding_data;

    m_passthrough_bytes = original_passthrough_bytes;

    m_push_constants = original_push_constants;

}


//==============================================================================

// Readback helpers

//==============================================================================


std::vector<float> GpuDispatchCore::readback_primary(size_t float_count)

{

    const size_t idx = find_first_output_index();


    for (const auto& b : m_bindings) {

        if (b.binding != idx)

            continue;

        if (b.element_type == GpuBufferBinding::ElementType::IMAGE_STORAGE

            || b.element_type == GpuBufferBinding::ElementType::IMAGE_SAMPLED)

            return {};

        break;

    }


    const size_t allocated = m_resources.buffer_allocated_bytes(dispatch_key(), idx);

    const size_t byte_size = std::min(float_count * sizeof(float), allocated);

    std::vector<float> out(byte_size / sizeof(float));

    m_resources.download(dispatch_key(), idx, out.data(), byte_size);

    return out;

}


void GpuDispatchCore::readback_aux(GpuChannelResult& result)

{

    for (const auto& b : m_bindings) {

        if (b.skip_auto_readback)

            continue;


        const size_t idx = b.binding;

        const bool is_image = b.element_type == GpuBufferBinding::ElementType::IMAGE_STORAGE

            || b.element_type == GpuBufferBinding::ElementType::IMAGE_SAMPLED;


        if ((b.direction == GpuBufferBinding::Direction::OUTPUT

                || b.direction == GpuBufferBinding::Direction::INPUT_OUTPUT)

            && !is_image

            && idx < m_output_size_overrides.size()

            && m_output_size_overrides[idx] > 0) {

            const size_t sz = m_output_size_overrides[idx];

            std::vector<uint8_t> raw(sz);

            m_resources.download(dispatch_key(), idx, reinterpret_cast<float*>(raw.data()), sz);

            result.aux[idx] = std::move(raw);

        }

    }

}


void GpuDispatchCore::download_binding(size_t index, void* dest, size_t byte_size)

{

    m_resources.download(dispatch_key(), index, reinterpret_cast<float*>(dest), byte_size);

}


//==============================================================================

// Internal helpers

//==============================================================================


void GpuDispatchCore::flatten_channels_to_staging(

    const std::vector<std::vector<double>>& channels,

    const DataStructureInfo& structure_info)

{

    m_staging_floats.clear();

    m_native_staging_bytes.clear();


    if (Kakshya::is_structured_modality(structure_info.modality))

        return;


    bool all_inputs_staged = !m_bindings.empty();

    for (size_t i = 0; i < m_bindings.size(); ++i) {

        if (m_bindings[i].direction == GpuBufferBinding::Direction::OUTPUT)

            continue;

        if (i >= m_binding_data.size() || m_binding_data[i].empty()) {

            all_inputs_staged = false;

            break;

        }

    }

    if (all_inputs_staged)

        return;


    size_t total = 0;


    for (const auto& ch : channels)

        total += ch.size();

    m_staging_floats.reserve(total);


    for (const auto& ch : channels) {

        for (double v : ch)

            m_staging_floats.push_back(static_cast<float>(v));

    }

}


void GpuDispatchCore::flatten_native_variants_to_staging(

    const std::vector<Kakshya::DataVariant>& variants,

    const DataStructureInfo& structure_info)

{

    m_native_staging_bytes.clear();


    if (variants.empty() || Kakshya::is_structured_modality(structure_info.modality))

        return;


    size_t total_bytes = 0;

    for (const auto& v : variants) {

        std::visit([&](const auto& vec) {

            total_bytes += vec.size() * sizeof(typename std::decay_t<decltype(vec)>::value_type);

        },

            v);

    }


    m_native_staging_bytes.reserve(total_bytes);


    for (const auto& v : variants) {

        std::visit([&](const auto& vec) {

            using T = typename std::decay_t<decltype(vec)>::value_type;

            const auto* bytes = reinterpret_cast<const uint8_t*>(vec.data());

            m_native_staging_bytes.insert(

                m_native_staging_bytes.end(),

                bytes,

                bytes + vec.size() * sizeof(T));

        },

            v);

    }

}


size_t GpuDispatchCore::find_first_output_index() const

{

    size_t first_inout = SIZE_MAX;

    for (const auto& b : m_bindings) {

        if (b.direction == GpuBufferBinding::Direction::OUTPUT)

            return b.binding;

        if (b.direction == GpuBufferBinding::Direction::INPUT_OUTPUT

            && first_inout == SIZE_MAX)

            first_inout = b.binding;

    }

    if (first_inout != SIZE_MAX)

        return first_inout;


    error<std::runtime_error>(Journal::Component::Yantra,

        Journal::Context::BufferProcessing,

        std::source_location::current(),

        "GpuDispatchCore: no output buffer declared");

}


size_t GpuDispatchCore::largest_binding_data_element_count() const

{

    size_t max_bytes = 0;

    for (const auto& b : m_bindings) {

        if (b.direction == GpuBufferBinding::Direction::OUTPUT)

            continue;

        const size_t idx = b.binding;

        if (idx < m_binding_data.size() && !m_binding_data[idx].empty())

            max_bytes = std::max(max_bytes, m_binding_data[idx].size());

    }

    return max_bytes / sizeof(float);

}


void GpuDispatchCore::update_dispatch_key_cache()

{

    m_cached_dispatch_key = m_gpu_config.shader_path.empty()

        ? std::to_string(m_gpu_config.shader_id)

        : m_gpu_config.shader_path;

}


void GpuDispatchCore::bind_all_descriptors()

{

    for (auto& m_binding : m_bindings) {

        const auto et = m_binding.element_type;

        if (et == GpuBufferBinding::ElementType::IMAGE_STORAGE

            || et == GpuBufferBinding::ElementType::IMAGE_SAMPLED)

            continue;


        const auto key = std::make_pair(m_binding.set, static_cast<size_t>(m_binding.binding));

        if (m_shared_bindings.contains(key)) {

            m_resources.bind_shared_descriptor(dispatch_key(), m_binding.set, m_binding.binding, m_binding);

            continue;

        }


        m_resources.bind_descriptor(dispatch_key(), static_cast<size_t>(m_binding.binding), m_binding);

    }

}


} // namespace MayaFlux::Yantra

image
IO::ImageData image
Definition Decoder.cpp:64

GpuDispatchCore.hpp

b
size_t b
Definition ProximityGraphs.cpp:20

VKImage.hpp

MayaFlux::Yantra::GpuDispatchCore::readback_aux
void readback_aux(GpuChannelResult &result)
Read back all OUTPUT bindings that have explicit size overrides into the aux map of a GpuChannelResul...
Definition GpuDispatchCore.cpp:441

MayaFlux::Yantra::GpuDispatchCore::stage_image_at
void stage_image_at(size_t binding_index, std::shared_ptr< Core::VKImage > image, GpuBufferBinding::ElementType kind, vk::Sampler sampler=nullptr)
Register a VKImage at an explicit binding index.
Definition GpuDispatchCore.cpp:68

MayaFlux::Yantra::GpuDispatchCore::m_image_bindings
std::vector< ImageBinding > m_image_bindings
Definition GpuDispatchCore.hpp:451

MayaFlux::Yantra::GpuDispatchCore::largest_binding_data_element_count
size_t largest_binding_data_element_count() const
Definition GpuDispatchCore.cpp:558

MayaFlux::Yantra::GpuDispatchCore::m_resources
GpuResourceManager m_resources
Definition GpuDispatchCore.hpp:437

MayaFlux::Yantra::GpuDispatchCore::calculate_dispatch_size
virtual std::array< uint32_t, 3 > calculate_dispatch_size(size_t total_elements, const DataStructureInfo &structure_info) const
Calculate workgroup dispatch counts from structure dimensions.
Definition GpuDispatchCore.cpp:208

MayaFlux::Yantra::GpuDispatchCore::is_gpu_ready
bool is_gpu_ready() const
Query GPU readiness without attempting initialisation.
Definition GpuDispatchCore.cpp:38

MayaFlux::Yantra::GpuDispatchCore::gpu_config
const GpuComputeConfig & gpu_config() const
Definition GpuDispatchCore.cpp:50

MayaFlux::Yantra::GpuDispatchCore::m_native_staging_bytes
std::vector< uint8_t > m_native_staging_bytes
Native-typed staging buffer.
Definition GpuDispatchCore.hpp:462

MayaFlux::Yantra::GpuDispatchCore::m_gpu_config
GpuComputeConfig m_gpu_config
Definition GpuDispatchCore.hpp:454

MayaFlux::Yantra::GpuDispatchCore::download_binding
void download_binding(size_t index, void *dest, size_t byte_size)
Read back a specific binding into a caller-provided destination.
Definition GpuDispatchCore.cpp:464

MayaFlux::Yantra::GpuDispatchCore::get_output_image
std::shared_ptr< Core::VKImage > get_output_image(size_t binding_index) const
Return the image registered at an IMAGE_STORAGE output binding.
Definition GpuDispatchCore.cpp:43

MayaFlux::Yantra::GpuDispatchCore::m_shared_bindings
std::set< std::pair< uint32_t, size_t > > m_shared_bindings
Definition GpuDispatchCore.hpp:444

MayaFlux::Yantra::GpuDispatchCore::GpuDispatchCore
GpuDispatchCore(GpuComputeConfig config)
Definition GpuDispatchCore.cpp:7

MayaFlux::Yantra::GpuDispatchCore::m_cached_dispatch_key
std::string m_cached_dispatch_key
Definition GpuDispatchCore.hpp:455

MayaFlux::Yantra::GpuDispatchCore::dispatch_key
const std::string & dispatch_key() const
The key used for this context's GpuResourceManager unit.
Definition GpuDispatchCore.hpp:227

MayaFlux::Yantra::GpuDispatchCore::m_push_constants
std::vector< uint8_t > m_push_constants
Definition GpuDispatchCore.hpp:440

MayaFlux::Yantra::GpuDispatchCore::m_binding_data
std::vector< std::vector< uint8_t > > m_binding_data
Definition GpuDispatchCore.hpp:443

MayaFlux::Yantra::GpuDispatchCore::flatten_native_variants_to_staging
void flatten_native_variants_to_staging(const std::vector< Kakshya::DataVariant > &variants, const DataStructureInfo &structure_info)
Flatten native-typed DataVariant channels into m_native_staging_bytes without any conversion.
Definition GpuDispatchCore.cpp:507

MayaFlux::Yantra::GpuDispatchCore::dispatch_core
GpuChannelResult dispatch_core(const std::vector< std::vector< double > > &channels, const DataStructureInfo &structure_info)
Full single-pass dispatch.
Definition GpuDispatchCore.cpp:244

MayaFlux::Yantra::GpuDispatchCore::stage_passthrough
void stage_passthrough(size_t binding_index, const void *data, size_t byte_size)
Stage raw bytes for a PASSTHROUGH binding before dispatch.
Definition GpuDispatchCore.cpp:59

MayaFlux::Yantra::GpuDispatchCore::dispatch_core_async
Portal::Graphics::FenceID dispatch_core_async(const std::vector< std::vector< double > > &channels, const DataStructureInfo &structure_info)
Non-blocking variant of dispatch_core.
Definition GpuDispatchCore.cpp:336

MayaFlux::Yantra::GpuDispatchCore::m_bindings
std::vector< GpuBufferBinding > m_bindings
Definition GpuDispatchCore.hpp:438

MayaFlux::Yantra::GpuDispatchCore::ensure_gpu_ready
bool ensure_gpu_ready()
Ensure GPU resources are initialised.
Definition GpuDispatchCore.cpp:30

MayaFlux::Yantra::GpuDispatchCore::m_output_size_overrides
std::vector< size_t > m_output_size_overrides
Definition GpuDispatchCore.hpp:441

MayaFlux::Yantra::GpuDispatchCore::dispatch_core_dependency
void dispatch_core_dependency(const std::vector< DependencyStage > &stages)
Multi-pipeline dependency dispatch.
Definition GpuDispatchCore.cpp:358

MayaFlux::Yantra::GpuDispatchCore::dispatch_core_chained
GpuChannelResult dispatch_core_chained(const std::vector< std::vector< double > > &channels, const DataStructureInfo &structure_info, const ExecutionContext &ctx)
Multi-pass (chained) dispatch.
Definition GpuDispatchCore.cpp:269

MayaFlux::Yantra::GpuDispatchCore::bind_all_descriptors
void bind_all_descriptors()
Definition GpuDispatchCore.cpp:578

MayaFlux::Yantra::GpuDispatchCore::prepare_gpu_inputs
virtual void prepare_gpu_inputs(const std::vector< std::vector< double > > &channels, const DataStructureInfo &structure_info)
Marshal channel data into GPU input buffers.
Definition GpuDispatchCore.cpp:109

MayaFlux::Yantra::GpuDispatchCore::m_passthrough_bytes
std::vector< std::vector< uint8_t > > m_passthrough_bytes
Definition GpuDispatchCore.hpp:442

MayaFlux::Yantra::GpuDispatchCore::stage_native_bytes
void stage_native_bytes(size_t binding_index, const void *data, size_t byte_size)
Stage a flat native-typed byte buffer for FLOAT32 bindings, bypassing the double-to-float cast in fla...
Definition GpuDispatchCore.cpp:82

MayaFlux::Yantra::GpuDispatchCore::m_last_effective_element_count
size_t m_last_effective_element_count
Definition GpuDispatchCore.hpp:457

MayaFlux::Yantra::GpuDispatchCore::on_before_gpu_dispatch
virtual void on_before_gpu_dispatch(const std::vector< std::vector< double > > &channels, const DataStructureInfo &structure_info)
Called immediately before dispatch.
Definition GpuDispatchCore.cpp:103

MayaFlux::Yantra::GpuDispatchCore::set_output_size
void set_output_size(size_t index, size_t byte_size)
Declare the byte capacity of an output binding independently of input data.
Definition GpuDispatchCore.cpp:23

MayaFlux::Yantra::GpuDispatchCore::m_staging_floats
std::vector< float > m_staging_floats
Definition GpuDispatchCore.hpp:439

MayaFlux::Yantra::GpuDispatchCore::update_dispatch_key_cache
void update_dispatch_key_cache()
Definition GpuDispatchCore.cpp:571

MayaFlux::Yantra::GpuDispatchCore::readback_primary
std::vector< float > readback_primary(size_t float_count)
Read back the primary output buffer into a float vector.
Definition GpuDispatchCore.cpp:421

MayaFlux::Yantra::GpuDispatchCore::dispatch_core_chained_indirect
GpuChannelResult dispatch_core_chained_indirect(const std::vector< std::vector< double > > &channels, const DataStructureInfo &structure_info, const ExecutionContext &ctx)
Multi-pass dispatch where a GPU-resident indirect buffer gates each pass's workgroup count instead of...
Definition GpuDispatchCore.cpp:294

MayaFlux::Yantra::GpuDispatchCore::flatten_channels_to_staging
void flatten_channels_to_staging(const std::vector< std::vector< double > > &channels, const DataStructureInfo &structure_info)
Flatten planar double channels into m_staging_floats.
Definition GpuDispatchCore.cpp:473

MayaFlux::Yantra::GpuDispatchCore::declare_buffer_bindings
virtual std::vector< GpuBufferBinding > declare_buffer_bindings() const
Declare the storage buffers the shader expects.
Definition GpuDispatchCore.cpp:95

MayaFlux::Yantra::GpuDispatchCore::find_first_output_index
size_t find_first_output_index() const
Definition GpuDispatchCore.cpp:539

MayaFlux::Yantra::GpuDispatchCore::set_push_constants
void set_push_constants(const void *data, size_t bytes)
Set push constant data from a raw byte pointer.
Definition GpuDispatchCore.cpp:17

MayaFlux::Yantra::GpuResourceManager::bind_image_sampled
void bind_image_sampled(const std::string &key, size_t index, const std::shared_ptr< Core::VKImage > &image, vk::Sampler sampler, const GpuBufferBinding &spec)
Bind a combined image+sampler descriptor at the given slot index.
Definition GpuResourceManager.cpp:434

MayaFlux::Yantra::GpuResourceManager::dispatch_batched_indirect
void dispatch_batched_indirect(const std::string &key, uint32_t indirect_set, size_t indirect_binding, const std::array< uint32_t, 3 > &groups, const std::vector< GpuBufferBinding > &bindings, size_t push_constant_size, const ExecutionContext &ctx)
Definition GpuResourceManager.cpp:601

MayaFlux::Yantra::GpuResourceManager::download
void download(const std::string &key, size_t index, float *dest, size_t byte_size)
Definition GpuResourceManager.cpp:331

MayaFlux::Yantra::GpuResourceManager::initialise
bool initialise(const std::string &key, const GpuComputeConfig &config, const std::vector< GpuBufferBinding > &bindings)
Create (or confirm existing) pipeline for the given key.
Definition GpuResourceManager.cpp:166

MayaFlux::Yantra::GpuResourceManager::is_ready
bool is_ready(const std::string &key) const
Definition GpuResourceManager.cpp:160

MayaFlux::Yantra::GpuResourceManager::upload
void upload(const std::string &key, size_t index, const float *data, size_t byte_size)
Definition GpuResourceManager.cpp:319

MayaFlux::Yantra::GpuResourceManager::transition_image
void transition_image(const std::shared_ptr< Core::VKImage > &image, vk::ImageLayout old_layout, vk::ImageLayout new_layout)
Transition a VKImage layout via an immediate command submission.
Definition GpuResourceManager.cpp:455

MayaFlux::Yantra::GpuResourceManager::bind_descriptor
void bind_descriptor(const std::string &key, size_t index, const GpuBufferBinding &spec)
Definition GpuResourceManager.cpp:337

MayaFlux::Yantra::GpuResourceManager::dispatch
void dispatch(const std::string &key, const std::array< uint32_t, 3 > &groups, const std::vector< GpuBufferBinding > &bindings, const uint8_t *push_constant_data, size_t push_constant_size)
Definition GpuResourceManager.cpp:474

MayaFlux::Yantra::GpuResourceManager::dispatch_async
Portal::Graphics::FenceID dispatch_async(const std::string &key, const std::array< uint32_t, 3 > &groups, const std::vector< GpuBufferBinding > &bindings, const uint8_t *push_constant_data, size_t push_constant_size)
Submit a compute dispatch without blocking.
Definition GpuResourceManager.cpp:656

MayaFlux::Yantra::GpuResourceManager::dispatch_sequence
void dispatch_sequence(const std::vector< std::string > &keys, const std::vector< std::array< uint32_t, 3 > > &groups_per_key, const std::vector< std::vector< uint8_t > > &push_constants_per_key, const std::vector< std::vector< Portal::Graphics::HazardResource > > &hazards_per_key)
Record a dispatch for each requested key into one command buffer via ComputePress::record_sequence,...
Definition GpuResourceManager.cpp:695

MayaFlux::Yantra::GpuResourceManager::bind_shared_descriptor
void bind_shared_descriptor(const std::string &key, uint32_t set, size_t binding_index, const GpuBufferBinding &spec)
Definition GpuResourceManager.cpp:378

MayaFlux::Yantra::GpuResourceManager::dispatch_batched
void dispatch_batched(const std::string &key, const std::array< uint32_t, 3 > &groups, const std::vector< GpuBufferBinding > &bindings, size_t push_constant_size, const ExecutionContext &ctx)
Definition GpuResourceManager.cpp:516

MayaFlux::Yantra::GpuResourceManager::ensure_buffer
void ensure_buffer(const std::string &key, size_t index, size_t required_bytes, Portal::Graphics::BufferUsageHint usage_hint=Portal::Graphics::BufferUsageHint::COMPUTE_STORAGE)
Definition GpuResourceManager.cpp:303

MayaFlux::Yantra::GpuResourceManager::upload_raw
void upload_raw(const std::string &key, size_t index, const uint8_t *data, size_t byte_size)
Definition GpuResourceManager.cpp:325

MayaFlux::Yantra::GpuResourceManager::buffer_allocated_bytes
size_t buffer_allocated_bytes(const std::string &key, size_t index) const
Definition GpuResourceManager.cpp:350

MayaFlux::Yantra::GpuResourceManager::bind_image_storage
void bind_image_storage(const std::string &key, size_t index, const std::shared_ptr< Core::VKImage > &image, const GpuBufferBinding &spec)
Bind a storage image descriptor at the given slot index.
Definition GpuResourceManager.cpp:415

MayaFlux::Journal::Context::BufferProcessing
@ BufferProcessing
Buffer processing (Buffers::BufferManager, processing chains)

MayaFlux::Journal::Context::Runtime
@ Runtime
General runtime operations (default fallback)

MayaFlux::Journal::Component::Yantra
@ Yantra
DSP algorithms, computational units, matrix operations, Grammar.

MayaFlux::Kakshya::is_structured_modality
bool is_structured_modality(DataModality modality)
Check if a modality represents structured data (vectors, matrices).
Definition NDData.hpp:200

MayaFlux::Portal::Graphics::FenceID
uint64_t FenceID
Definition ShaderUtils.hpp:70

MayaFlux::Portal::Graphics::BufferUsageHint::INDIRECT
@ INDIRECT
Indirect draw/dispatch buffer (device-local)

MayaFlux::Yantra
Definition ComputeRegistry.hpp:5

MayaFlux::is_image
bool is_image(const fs::path &filepath)
Definition Depot.cpp:108

std
Definition BufferUtils.hpp:228

MayaFlux::Kakshya::ContainerDataStructure::get_total_elements
uint64_t get_total_elements() const
Definition NDimensionalContainer.hpp:126

MayaFlux::Kakshya::DataDimension::Role::SPATIAL_Y
@ SPATIAL_Y
Spatial Y axis.

MayaFlux::Kakshya::DataDimension::Role::SPATIAL_Z
@ SPATIAL_Z
Spatial Z axis.

MayaFlux::Kakshya::DataDimension::Role::SPATIAL_X
@ SPATIAL_X
Spatial X axis (images, tensors)

MayaFlux::Portal::Graphics::GpuBufferBinding::ElementType
ElementType
Element type the shader expects in this binding.
Definition GraphicsUtils.hpp:175

MayaFlux::Portal::Graphics::GpuBufferBinding::ElementType::UINT32
@ UINT32

MayaFlux::Portal::Graphics::GpuBufferBinding::ElementType::IMAGE_STORAGE
@ IMAGE_STORAGE

MayaFlux::Portal::Graphics::GpuBufferBinding::ElementType::INT32
@ INT32

MayaFlux::Portal::Graphics::GpuBufferBinding::ElementType::IMAGE_SAMPLED
@ IMAGE_SAMPLED

MayaFlux::Portal::Graphics::GpuBufferBinding::ElementType::PASSTHROUGH
@ PASSTHROUGH

MayaFlux::Portal::Graphics::GpuBufferBinding::Direction::OUTPUT
@ OUTPUT

MayaFlux::Portal::Graphics::GpuBufferBinding::Direction::INPUT_OUTPUT
@ INPUT_OUTPUT

MayaFlux::Portal::Graphics::GpuBufferBinding::INPUT
enum MayaFlux::Portal::Graphics::GpuBufferBinding::Direction INPUT

MayaFlux::Portal::Graphics::GpuBufferBinding::FLOAT32
enum MayaFlux::Portal::Graphics::GpuBufferBinding::ElementType FLOAT32

MayaFlux::Portal::Graphics::GpuComputeConfig::push_constant_size
size_t push_constant_size
Definition ShaderUtils.hpp:111

MayaFlux::Portal::Graphics::GpuComputeConfig::shader_id
ShaderID shader_id
Definition ShaderUtils.hpp:112

MayaFlux::Portal::Graphics::GpuComputeConfig::workgroup_size
std::array< uint32_t, 3 > workgroup_size
Definition ShaderUtils.hpp:110

MayaFlux::Portal::Graphics::GpuComputeConfig::shader_path
std::string shader_path
Definition ShaderUtils.hpp:109

MayaFlux::Portal::Graphics::GpuComputeConfig
Plain-data description of the compute shader to dispatch.
Definition ShaderUtils.hpp:108

MayaFlux::Yantra::DataStructureInfo::modality
Kakshya::DataModality modality
Definition OperationHelper.hpp:15

MayaFlux::Yantra::DataStructureInfo::dimensions
std::vector< Kakshya::DataDimension > dimensions
Definition OperationHelper.hpp:16

MayaFlux::Yantra::DataStructureInfo
Metadata about data structure for reconstruction.
Definition OperationHelper.hpp:14

MayaFlux::Yantra::ExecutionContext
Context information controlling how a compute operation executes.
Definition ExecutionContext.hpp:111

MayaFlux::Yantra::GpuChannelResult::aux
std::unordered_map< size_t, std::vector< uint8_t > > aux
Definition GpuDispatchCore.hpp:24

MayaFlux::Yantra::GpuChannelResult::primary
std::vector< float > primary
Definition GpuDispatchCore.hpp:23

MayaFlux::Yantra::GpuChannelResult
Erased output of a GPU dispatch: reconstructed float data plus any raw auxiliary outputs keyed by bin...
Definition GpuDispatchCore.hpp:22