К вопросу об увеличении производительности машинного обучения на этапе выборки данных при решении задач классификации

Авторы

DOI:

https://doi.org/10.17308/sait/1995-5499/2022/4/146-155

Ключевые слова:

выборка данных, нейронные сети, Point Cloud, ЦУР

Аннотация

Целью исследования является определение метода хранения данных для задач машинного обучения нейронных сетей и семантической сегментации облаков точек. Рассмотрены существующие способы хранения массивов данных большого размера, проведены экспериментальные исследования для определения быстродействия операции чтения данных. Во время проведения эксперимента была осуществлена подготовка данных, заключающаяся в отборе информации из общей выборки. В качестве критериев отбора выделяются координаты точек, метка класса и количество записей в исходном дата сете. Все необходимые параметры и их структура приведены и описаны в работе. Метки класса, в силу представления исходного дата сета, претерпели некоторое преобразование. После отбора информации была произведена ее конвертация в исследуемые форматы файлов с последующим сохранением для проведения экспериментов. Для проведения исследований были взяты наиболее распространенные форматы файлов, используемые для хранения информации *.csv, *.npy и *.h5. После получения данных для эксперимента последовал этап непосредственно проведения эксперимента. Эксперимент заключался в воспроизведении процесса доступа к информации из предварительно полученных файлов и последующей загрузкой информации на входной слой нейронной сети без процесса обучения. Результатом эксперимента стала статистическая информация о времени чтения файла в зависимости от выбранной структуры и объема хранимой в нем информации. Кроме этого, был подведен итог о целесообразности использования того или иного способа хранения информации в условиях предметной области работы, исходя из принципа работы того или иного формата файла.

Биографии авторов

  • Роман Александрович Дьяченко, Кубанский государственный технологический университет

    д-р техн. наук, проф., профессор кафедры Информатики и вычислительной техники Кубанского государственного технологического университета

  • Павел Александрович Косолапов, Кубанский государственный технологический университет

    аспирант кафедры информатики и вычислительной техники Кубанского государственного технологического университета

  • Дмитрий Андреевич Гура, Кубанский государственный аграрный университет им. И. Т. Трубилина

    канд. техн. наук, доц., доцент кафедры Кадастра и геоинженерии Кубанского государственного технологического университета, доцент кафедры Геодезии Кубанского государственного аграрного университета им. И. Т. Трубилина

Библиографические ссылки

Загрузки

Опубликован

2022-12-26

Выпуск

Раздел

Интеллектуальные системы, анализ данных и машинное обучение

Как цитировать

К вопросу об увеличении производительности машинного обучения на этапе выборки данных при решении задач классификации. (2022). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 4, 146-155. https://doi.org/10.17308/sait/1995-5499/2022/4/146-155

Наиболее читаемые статьи этого автора (авторов)