MayaFlux/DataUtils_8cpp_source.html

#include "DataUtils.hpp"


namespace MayaFlux::Kakshya {


uint64_t calculate_total_elements(const std::vector<DataDimension>& dimensions)

{

    if (dimensions.empty())

        return 0;


    return std::transform_reduce(dimensions.begin(), dimensions.end(),

        uint64_t(1), std::multiplies<>(),

        [](const DataDimension& dim) { return dim.size; });

}


uint64_t calculate_frame_size(const std::vector<DataDimension>& dimensions)

{

    if (dimensions.empty())

        return 0;


    return std::transform_reduce(

        dimensions.begin() + 1, dimensions.end(),

        uint64_t(1), std::multiplies<>(),

        [](const DataDimension& dim) constexpr { return dim.size; });

}


std::type_index get_variant_type_index(const DataVariant& data)

{

    return std::visit([](const auto& vec) -> std::type_index {

        return std::type_index(typeid(decltype(vec)));

    },

        data);

}


void safe_copy_data_variant(const DataVariant& input, DataVariant& output)

{

    std::visit([&](const auto& input_vec, auto& output_vec) {

        using InputType = typename std::decay_t<decltype(input_vec)>::value_type;

        using OutputType = typename std::decay_t<decltype(output_vec)>::value_type;


        if constexpr (ProcessableData<InputType> && ProcessableData<OutputType>) {

            std::vector<OutputType> temp_storage;

            auto input_span = extract_from_variant<OutputType>(input, temp_storage);


            output_vec.resize(input_span.size());

            std::copy(input_span.begin(), input_span.end(), output_vec.begin());

        } else {

            error<std::invalid_argument>(

                Journal::Component::Kakshya,

                Journal::Context::Runtime,

                std::source_location::current(),

                "Unsupported type conversion from {} to {}",

                typeid(InputType).name(),

                typeid(OutputType).name());

        }

    },

        input, output);

}


void set_metadata_value(std::unordered_map<std::string, std::any>& metadata, const std::string& key, std::any value)

{

    metadata[key] = std::move(value);

}


int find_dimension_by_role(const std::vector<DataDimension>& dimensions, DataDimension::Role role)

{

    auto it = std::ranges::find_if(dimensions,

        [role](const DataDimension& dim) { return dim.role == role; });


    return (it != dimensions.end()) ? static_cast<int>(std::distance(dimensions.begin(), it)) : -1;

}


DataModality detect_data_modality(const std::vector<DataDimension>& dimensions)

{

    if (dimensions.empty()) {

        return DataModality::UNKNOWN;

    }


    size_t time_dims = 0, spatial_dims = 0, channel_dims = 0, frequency_dims = 0, custom_dims = 0;

    size_t total_spatial_elements = 1;

    size_t total_channels = 0;


    for (const auto& dim : dimensions) {

        if (dim.grouping) {

            switch (dim.role) {

            case DataDimension::Role::POSITION:

                return DataModality::VERTEX_POSITIONS_3D;

            case DataDimension::Role::NORMAL:

                return DataModality::VERTEX_NORMALS_3D;

            case DataDimension::Role::TANGENT:

            case DataDimension::Role::BITANGENT:

                return DataModality::VERTEX_TANGENTS_3D;

            case DataDimension::Role::UV:

                return DataModality::TEXTURE_COORDS_2D;

            case DataDimension::Role::COLOR:

                if (dim.grouping->count == 3)

                    return DataModality::VERTEX_COLORS_RGB;

                if (dim.grouping->count == 4)

                    return DataModality::VERTEX_COLORS_RGBA;

                break;

            default:

                if (dim.grouping->count == 16)

                    return DataModality::TRANSFORMATION_MATRIX;

                break;

            }

        }

    }


    for (const auto& dim : dimensions) {

        switch (dim.role) {

        case DataDimension::Role::TIME:

            time_dims++;

            break;

        case DataDimension::Role::SPATIAL_X:

        case DataDimension::Role::SPATIAL_Y:

        case DataDimension::Role::SPATIAL_Z:

            spatial_dims++;

            total_spatial_elements *= dim.size;

            break;

        case DataDimension::Role::CHANNEL:

            channel_dims++;

            total_channels += dim.size;

            break;

        case DataDimension::Role::FREQUENCY:

            frequency_dims++;

            break;

        case DataDimension::Role::CUSTOM:

        default:

            custom_dims++;

            break;

        }

    }


    if (time_dims == 1 && spatial_dims == 0 && frequency_dims == 0) {

        if (channel_dims == 0) {

            return DataModality::AUDIO_1D;

        } else if (channel_dims == 1) {

            return (total_channels <= 1) ? DataModality::AUDIO_1D : DataModality::AUDIO_MULTICHANNEL;

        } else {

            return DataModality::AUDIO_MULTICHANNEL;

        }

    }


    if (time_dims >= 1 && frequency_dims >= 1) {

        if (spatial_dims == 0 && channel_dims <= 1) {

            return DataModality::SPECTRAL_2D;

        }

        return DataModality::TENSOR_ND;

    }


    if (spatial_dims >= 2 && time_dims == 0) {

        if (spatial_dims == 2) {

            if (channel_dims == 0) {

                return DataModality::IMAGE_2D;

            } else if (channel_dims == 1 && total_channels >= 3) {

                return DataModality::IMAGE_COLOR;

            } else {

                return DataModality::IMAGE_2D;

            }

        } else if (spatial_dims == 3) {

            return DataModality::VOLUMETRIC_3D;

        }

    }


    if (time_dims >= 1 && spatial_dims >= 2) {

        if (spatial_dims == 2) {

            if (channel_dims == 0 || (channel_dims == 1 && total_channels <= 1)) {

                return DataModality::VIDEO_GRAYSCALE;

            } else {

                return DataModality::VIDEO_COLOR;

            }

        }

        return DataModality::TENSOR_ND;

    }


    if (spatial_dims == 2 && time_dims == 0 && channel_dims >= 1) {

        if (total_spatial_elements >= 64 && total_channels >= 1) {

            return DataModality::TEXTURE_2D;

        }

    }


    return DataModality::TENSOR_ND;

}


std::vector<DataDimension> detect_data_dimensions(const DataVariant& data)

{

    std::cerr << "Inferring structure from single DataVariant...\n"

              << "This is not advisable as the method makes naive assumptions that can lead to massive computational errors\n"

              << "If the variant is part of a container, region, or segment, please use the appropriate method instead.\n"

              << "If the variant is part of a vector, please use infer_from_data_variant_vector instead.\n"

              << "If you are sure you want to proceed, please ignore this warning.\n";


    return std::visit([](const auto& vec) -> std::vector<DataDimension> {

        using ValueType = typename std::decay_t<decltype(vec)>::value_type;


        std::vector<DataDimension> dims;


        if constexpr (DecimalData<ValueType>) {

            dims.emplace_back(DataDimension::time(vec.size()));


        } else if constexpr (ComplexData<ValueType>) {

            dims.emplace_back(DataDimension::frequency(vec.size()));


        } else if constexpr (IntegerData<ValueType>) {

            // uint8_t, uint16_t, uint32_t -> flattened 2D (images typically)

            // Need to guess reasonable 2D dimensions from 1D size

            uint64_t total_size = vec.size();


            if (total_size == 0) {

                dims.emplace_back(DataDimension::spatial(0, 'x'));

                dims.emplace_back(DataDimension::spatial(0, 'y'));

            } else {

                auto sqrt_size = static_cast<uint64_t>(std::sqrt(total_size));

                if (sqrt_size * sqrt_size == total_size) {

                    dims.emplace_back(DataDimension::spatial(sqrt_size, 'x'));

                    dims.emplace_back(DataDimension::spatial(sqrt_size, 'y'));

                } else {

                    uint64_t width = sqrt_size;

                    uint64_t height = total_size / width;

                    while (width * height != total_size && width > 1) {

                        width--;

                        height = total_size / width;

                    }

                    dims.emplace_back(DataDimension::spatial(height, 'y'));

                    dims.emplace_back(DataDimension::spatial(width, 'x'));

                }

            }

        } else if constexpr (GlmData<ValueType>) {

            constexpr size_t components = glm_component_count<ValueType>();

            DataDimension::Role role = DataDimension::Role::CUSTOM;


            if constexpr (GlmVec2Type<ValueType>) {

                role = DataDimension::Role::UV;

            } else if constexpr (GlmVec3Type<ValueType>) {

                role = DataDimension::Role::POSITION;

            } else if constexpr (GlmVec4Type<ValueType>) {

                role = DataDimension::Role::COLOR;

            } else if constexpr (GlmMatrixType<ValueType>) {

                role = DataDimension::Role::CUSTOM;

            }


            dims.push_back(DataDimension::grouped(

                "glm_structured_data",

                static_cast<uint64_t>(vec.size()),

                static_cast<uint8_t>(components),

                role));

        } else {

            dims.emplace_back(DataDimension::time(vec.size()));

        }


        return dims;

    },

        data);

}


std::vector<DataDimension> detect_data_dimensions(

    const std::vector<DataVariant>& variants)

{

    std::cerr << "Inferring structure from DataVariant vector...\n"

              << "This is not advisable as the method makes naive assumptions that can lead to massive computational errors\n"

              << "If the variant is part of a container, region, or segment, please use the appropriate method instead.\n"

              << "If you are sure you want to proceed, please ignore this warning.\n";


    if (variants.empty()) {

        std::vector<DataDimension> dims;

        dims.emplace_back("empty_variants", 0, 1, DataDimension::Role::CUSTOM);

        return dims;

    }


    std::vector<DataDimension> dimensions;

    size_t variant_count = variants.size();


    size_t first_variant_size = std::visit([](const auto& vec) -> size_t {

        return vec.size();

    },

        variants[0]);


    bool consistent_glm = std::ranges::all_of(variants, [](const auto& variant) {

        return std::visit([](const auto& vec) -> bool {

            using ValueType = typename std::decay_t<decltype(vec)>::value_type;

            return GlmData<ValueType>;

        },

            variant);

    });


    bool consistent_decimal = std::ranges::all_of(variants, [](const auto& variant) {

        return std::visit([](const auto& vec) -> bool {

            using ValueType = typename std::decay_t<decltype(vec)>::value_type;

            return MayaFlux::DecimalData<ValueType>;

        },

            variant);

    });


    bool consistent_complex = std::ranges::all_of(variants, [](const auto& variant) {

        return std::visit([](const auto& vec) -> bool {

            using ValueType = typename std::decay_t<decltype(vec)>::value_type;

            return MayaFlux::ComplexData<ValueType>;

        },

            variant);

    });


    bool consistent_integer = std::ranges::all_of(variants, [](const auto& variant) {

        return std::visit([](const auto& vec) -> bool {

            using ValueType = typename std::decay_t<decltype(vec)>::value_type;

            return MayaFlux::IntegerData<ValueType>;

        },

            variant);

    });


    if (consistent_glm) {

        dimensions.emplace_back(DataDimension::channel(variant_count));


        std::visit([&](const auto& first_vec) {

            using ValueType = typename std::decay_t<decltype(first_vec)>::value_type;

            constexpr size_t components = glm_component_count<ValueType>();


            DataDimension::Role role = DataDimension::Role::CUSTOM;

            if constexpr (GlmVec2Type<ValueType>) {

                role = DataDimension::Role::UV;

            } else if constexpr (GlmVec3Type<ValueType>) {

                role = DataDimension::Role::POSITION;

            } else if constexpr (GlmVec4Type<ValueType>) {

                role = DataDimension::Role::COLOR;

            }


            dimensions.emplace_back(DataDimension::grouped(

                "glm_elements",

                first_variant_size,

                static_cast<uint8_t>(components),

                role));

        },

            variants[0]);


        return dimensions;

    }


    if (variant_count == 1) {

        if (consistent_decimal) {

            dimensions.emplace_back(DataDimension::time(first_variant_size, "samples"));

        } else if (consistent_complex) {

            dimensions.emplace_back(DataDimension::frequency(first_variant_size, "frequency_data"));

        } else if (consistent_integer) {

            dimensions.emplace_back(DataDimension::spatial(first_variant_size, 'x', 1, "data_points"));

        } else {

            dimensions.emplace_back("unknown_data", first_variant_size, 1,

                DataDimension::Role::CUSTOM);

        }


    } else if (variant_count == 2 && (consistent_decimal || consistent_complex || consistent_integer)) {

        dimensions.emplace_back(DataDimension::channel(2));

        if (consistent_decimal) {

            dimensions.emplace_back(DataDimension::time(first_variant_size, "samples"));

        } else if (consistent_complex) {

            dimensions.emplace_back(DataDimension::frequency(first_variant_size, "bins"));

        } else {

            dimensions.emplace_back(DataDimension::spatial(first_variant_size, 'x', 1, "elements"));

        }


    } else if (variant_count <= 16 && (consistent_decimal || consistent_complex || consistent_integer)) {

        dimensions.emplace_back(DataDimension::channel(variant_count));

        if (consistent_decimal) {

            dimensions.emplace_back(DataDimension::time(first_variant_size, "samples"));

        } else if (consistent_complex) {

            dimensions.emplace_back(DataDimension::frequency(first_variant_size, "bins"));

        } else {

            dimensions.emplace_back(DataDimension::spatial(first_variant_size, 'x', 1, "pixels"));

        }


    } else if (consistent_decimal || consistent_complex || consistent_integer) {

        if (consistent_decimal) {

            dimensions.emplace_back(DataDimension::time(variant_count, "time_blocks"));

            dimensions.emplace_back("block_samples", first_variant_size, 1,

                DataDimension::Role::CUSTOM);

        } else if (consistent_complex) {

            dimensions.emplace_back(DataDimension::time(variant_count, "time_windows"));

            dimensions.emplace_back(DataDimension::frequency(first_variant_size, "frequency_bins"));

        } else {

            dimensions.emplace_back(DataDimension::time(variant_count, "frames"));

            dimensions.emplace_back(DataDimension::spatial(first_variant_size, 'x', 1, "frame_data"));

        }


    } else {

        dimensions.emplace_back("mixed_variants", variant_count, 1,

            DataDimension::Role::CUSTOM);

        dimensions.emplace_back("variant_data", first_variant_size, 1,

            DataDimension::Role::CUSTOM);

    }


    return dimensions;

}


}

DataUtils.hpp

MayaFlux::Journal::Context::Runtime
@ Runtime
General runtime operations (default fallback)

MayaFlux::Journal::Component::Kakshya
@ Kakshya
Containers[Signalsource, Stream, File], Regions, DataProcessors.

MayaFlux::Kakshya::detect_data_dimensions
std::vector< DataDimension > detect_data_dimensions(const DataVariant &data)
Detect data dimensions from a DataVariant.
Definition DataUtils.cpp:184

MayaFlux::Kakshya::calculate_frame_size
uint64_t calculate_frame_size(const std::vector< DataDimension > &dimensions)
Calculate the frame size (number of elements per frame) for a set of dimensions.
Definition DataUtils.cpp:15

MayaFlux::Kakshya::DataVariant
std::variant< std::vector< double >, std::vector< float >, std::vector< uint8_t >, std::vector< uint16_t >, std::vector< uint32_t >, std::vector< std::complex< float > >, std::vector< std::complex< double > >, std::vector< glm::vec2 >, std::vector< glm::vec3 >, std::vector< glm::vec4 >, std::vector< glm::mat4 > > DataVariant
Multi-type data storage for different precision needs.
Definition NDData.hpp:73

MayaFlux::Kakshya::DataModality
DataModality
Data modality types for cross-modal analysis.
Definition NDData.hpp:78

MayaFlux::Kakshya::DataModality::VERTEX_COLORS_RGB
@ VERTEX_COLORS_RGB

MayaFlux::Kakshya::DataModality::VERTEX_POSITIONS_3D
@ VERTEX_POSITIONS_3D

MayaFlux::Kakshya::DataModality::AUDIO_MULTICHANNEL
@ AUDIO_MULTICHANNEL
Multi-channel audio.

MayaFlux::Kakshya::DataModality::SPECTRAL_2D
@ SPECTRAL_2D
2D spectral data (time + frequency)

MayaFlux::Kakshya::DataModality::TRANSFORMATION_MATRIX
@ TRANSFORMATION_MATRIX

MayaFlux::Kakshya::DataModality::AUDIO_1D
@ AUDIO_1D
1D audio signal

MayaFlux::Kakshya::DataModality::TEXTURE_COORDS_2D
@ TEXTURE_COORDS_2D

MayaFlux::Kakshya::DataModality::VERTEX_TANGENTS_3D
@ VERTEX_TANGENTS_3D

MayaFlux::Kakshya::DataModality::UNKNOWN
@ UNKNOWN
Unknown or undefined modality.

MayaFlux::Kakshya::DataModality::VOLUMETRIC_3D
@ VOLUMETRIC_3D
3D volumetric data

MayaFlux::Kakshya::DataModality::VERTEX_NORMALS_3D
@ VERTEX_NORMALS_3D

MayaFlux::Kakshya::DataModality::VIDEO_GRAYSCALE
@ VIDEO_GRAYSCALE
3D video (time + 2D grayscale)

MayaFlux::Kakshya::DataModality::VIDEO_COLOR
@ VIDEO_COLOR
4D video (time + 2D + color)

MayaFlux::Kakshya::DataModality::TENSOR_ND
@ TENSOR_ND
N-dimensional tensor.

MayaFlux::Kakshya::DataModality::TEXTURE_2D
@ TEXTURE_2D
2D texture data

MayaFlux::Kakshya::DataModality::IMAGE_COLOR
@ IMAGE_COLOR
2D RGB/RGBA image

MayaFlux::Kakshya::DataModality::IMAGE_2D
@ IMAGE_2D
2D image (grayscale or single channel)

MayaFlux::Kakshya::DataModality::VERTEX_COLORS_RGBA
@ VERTEX_COLORS_RGBA

MayaFlux::Kakshya::get_variant_type_index
std::type_index get_variant_type_index(const DataVariant &data)
Get type index from DataVariant.
Definition DataUtils.cpp:26

MayaFlux::Kakshya::find_dimension_by_role
int find_dimension_by_role(const std::vector< DataDimension > &dimensions, DataDimension::Role role)
Find the index of a dimension by its semantic role.
Definition DataUtils.cpp:64

MayaFlux::Kakshya::set_metadata_value
void set_metadata_value(std::unordered_map< std::string, std::any > &metadata, const std::string &key, std::any value)
Set a value in a metadata map (key-value).
Definition DataUtils.cpp:59

MayaFlux::Kakshya::detect_data_modality
DataModality detect_data_modality(const std::vector< DataDimension > &dimensions)
Detects data modality from dimension information.
Definition DataUtils.cpp:72

MayaFlux::Kakshya::safe_copy_data_variant
void safe_copy_data_variant(const DataVariant &input, DataVariant &output)
Safely copy data from a DataVariant to another DataVariant, handling type conversion.
Definition DataUtils.cpp:34

MayaFlux::Kakshya::calculate_total_elements
uint64_t calculate_total_elements(const std::vector< DataDimension > &dimensions)
Calculate the total number of elements in an N-dimensional container.
Definition DataUtils.cpp:5

MayaFlux::Kakshya
Definition Depot.hpp:18

MayaFlux::Kakshya::DataDimension::Role
Role
Semantic role of the dimension.
Definition NDData.hpp:145

MayaFlux::Kakshya::DataDimension::Role::COLOR
@ COLOR
Color data (RGB/RGBA)

MayaFlux::Kakshya::DataDimension::Role::NORMAL
@ NORMAL
Surface normals.

MayaFlux::Kakshya::DataDimension::Role::FREQUENCY
@ FREQUENCY
Spectral/frequency axis.

MayaFlux::Kakshya::DataDimension::Role::SPATIAL_Y
@ SPATIAL_Y
Spatial Y axis.

MayaFlux::Kakshya::DataDimension::Role::TIME
@ TIME
Temporal progression (samples, frames, steps)

MayaFlux::Kakshya::DataDimension::Role::BITANGENT
@ BITANGENT
Bitangent vectors.

MayaFlux::Kakshya::DataDimension::Role::TANGENT
@ TANGENT
Tangent vectors.

MayaFlux::Kakshya::DataDimension::Role::CUSTOM
@ CUSTOM
User-defined or application-specific.

MayaFlux::Kakshya::DataDimension::Role::SPATIAL_Z
@ SPATIAL_Z
Spatial Z axis.

MayaFlux::Kakshya::DataDimension::Role::POSITION
@ POSITION
Vertex positions (3D space)

MayaFlux::Kakshya::DataDimension::Role::UV
@ UV
Texture coordinates.

MayaFlux::Kakshya::DataDimension::Role::CHANNEL
@ CHANNEL
Parallel streams (audio channels, color channels)

MayaFlux::Kakshya::DataDimension::Role::SPATIAL_X
@ SPATIAL_X
Spatial X axis (images, tensors)

MayaFlux::Kakshya::DataDimension::size
uint64_t size
Number of elements in this dimension.
Definition NDData.hpp:188

MayaFlux::Kakshya::DataDimension::role
Role role
Semantic hint for common operations.
Definition NDData.hpp:190

MayaFlux::Kakshya::DataDimension::spatial
static DataDimension spatial(uint64_t size, char axis, uint64_t stride=1, std::string name="spatial")
Convenience constructor for a spatial dimension.
Definition NDData.cpp:29

MayaFlux::Kakshya::DataDimension::grouped
static DataDimension grouped(std::string name, uint64_t element_count, uint8_t components_per_element, Role role=Role::CUSTOM)
Create dimension with component grouping.
Definition NDData.cpp:69

MayaFlux::Kakshya::DataDimension::frequency
static DataDimension frequency(uint64_t bins, std::string name="frequency")
Convenience constructor for a frequency dimension.
Definition NDData.cpp:24

MayaFlux::Kakshya::DataDimension::time
static DataDimension time(uint64_t samples, std::string name="time")
Convenience constructor for a temporal (time) dimension.
Definition NDData.cpp:14

MayaFlux::Kakshya::DataDimension::channel
static DataDimension channel(uint64_t count, uint64_t stride=1)
Convenience constructor for a channel dimension.
Definition NDData.cpp:19

MayaFlux::Kakshya::DataDimension
Minimal dimension descriptor focusing on structure only.
Definition NDData.hpp:138