Правовое регулирование индустрии аннотации данных как способ обеспечения качества данных

  • Э. И. Лескина Национальный исследовательский университет «Высшая школа экономики» (Москва)
Ключевые слова: большие данные, искусственный интеллект, экономика данных, аннотация данных, аннотирование, маркировка, разметка, качество данных

Аннотация

Национальный проект «Экономика данных», направленный на цифровую трансформацию различных сфер, является следующей ступенью для обеспечения научно-технологического суверенитета в Российской Федерации, при этом ключевым моментом для реализации многочисленных направлений, федеральных проектов, мероприятий в рамках национального проекта является повышение качества как данных, так и их наборов, обеспечение роста доступных для использования различными субъектами данных. Вопросы качества данных и особенно управления таким качеством остаются за рамками нормативного обеспечения и регулирования. Между тем одним из способов обеспечения качества данных является индустрия аннотации данных. Многие страны обращают внимание на потенциал, заложенный в развитии данного направления, начинают принимать стратегические документы. В статье обосновывается необходимость нормативного обеспечения развития индустрии аннотации данных в Российской Федерации, рассматриваются зарубежные подходы, которые в настоящее время начинают формироваться в данной сфере, предлагаются направления, которые следует развивать для системного становления индустрии аннотации в России как способа обеспечения качества данных. Обращается внимание на многогранность потенциала аннотации данных, в том числе для обеспечения качества алгоритмов, развития узко специализированных моделей искусственного интеллекта.

Скачивания

Данные скачивания пока не доступны.

Биография автора

Э. И. Лескина, Национальный исследовательский университет «Высшая школа экономики» (Москва)

кандидат юридических наук, доцент департамента права цифровых технологий и биоправа факультета права

Литература

Aleynikova D. V. Annotation of data as an object of education for students of socio-humanitarian orientation // Bulletin of the Moscow State Linguistic University. un-ta. Education and pedagogical sciences. 2022. Issue 4 (845). P. 15–19.
Voynikanis E. A. Regulation of big data and intellectual property law : general approaches, problems and development prospects // Law. 2020. No. 7. P. 135–156.
Gilyazev R. A., Turdakov D. Yu. Active learning and crowdsourcing : a review of data markup optimization methods // Proceedings of the ISP RAS. 2018. Vol. 30, issue. 2. P. 215–250.
Global Atlas of Artifi cial Intelligence regulation. Vector BRICS / E. O.Vasin, A. D.Gvozdyreva, A. P. Deineka [et al.] ; ed. by A. V. Neznamov. 3rd ed., revised and add. Access from the legal reference system «ConsultantPlus». The state, society and personality : ways to overcome challenges and threats in the information sphere : a monograph / N. S. Volkova, A. A. Efremov, S. M. Zyryanov [et al.] ; ed. by L. K. Tereshchenko. Moscow : Infotropik Media, 2024. 352 p.
Mcafee E., Brynjolfson E. Car, platform, crowd. Our digital Future. Moscow, 2019. 368 p.
Nazarov N. A. Data quality assurance in automated decision-making in public administration // Journal of Russian Law. 2024. No. 5. P. 140–155.
Tereshchenko L. K. The legal regime of information. Moscow : Jurisprudence, 2007. 192 p.
Kharitonova Yu. S., Savina V. S., Panini F. Bias of artificial intelligence algorithms : issues of ethics and law // Bulletin of Perm. un-ta. Legal sciences. 2021. No. 3. P. 488–515.
Chaika M. A practical approach to the validation of rating models in the implementation of the PVR approach : the 5×5 methodology // Risk management in a credit institution. 2024. No. 1. P. 19–34.
Braun D. I beg to difer: how disagreement is handled in the annotation of legal machine learning data sets // Artifcial Intelligence and Law. 2024. No. 32. Р.839–862. URL: https://doi.org/10.1007/s10506-023-09369-4
Gray M., Savelka J., Oliver W., Ashley K. Can GPT Alleviate the Burden of Annotation? // Legal Knowledge and Information Systems. 2013. URL: https://www.researchgate.net/publication/376422423_Can_GPT_ Alleviate_the_Burden_of_Annotation
Subinay A, Procheta S., Dwaipayan R., Kripabandhu Gh. A case study for automated attribute extraction from legal documents using large language models // Artifi cial Intelligence and Law. 2024. November.
Опубликован
2025-12-04
Раздел
Цифровое право. Искусственный интеллект