Правовое регулирование индустрии аннотации данных как способ обеспечения качества данных
Аннотация
Национальный проект «Экономика данных», направленный на цифровую трансформацию различных сфер, является следующей ступенью для обеспечения научно-технологического суверенитета в Российской Федерации, при этом ключевым моментом для реализации многочисленных направлений, федеральных проектов, мероприятий в рамках национального проекта является повышение качества как данных, так и их наборов, обеспечение роста доступных для использования различными субъектами данных. Вопросы качества данных и особенно управления таким качеством остаются за рамками нормативного обеспечения и регулирования. Между тем одним из способов обеспечения качества данных является индустрия аннотации данных. Многие страны обращают внимание на потенциал, заложенный в развитии данного направления, начинают принимать стратегические документы. В статье обосновывается необходимость нормативного обеспечения развития индустрии аннотации данных в Российской Федерации, рассматриваются зарубежные подходы, которые в настоящее время начинают формироваться в данной сфере, предлагаются направления, которые следует развивать для системного становления индустрии аннотации в России как способа обеспечения качества данных. Обращается внимание на многогранность потенциала аннотации данных, в том числе для обеспечения качества алгоритмов, развития узко специализированных моделей искусственного интеллекта.
Скачивания
Литература
Voynikanis E. A. Regulation of big data and intellectual property law : general approaches, problems and development prospects // Law. 2020. No. 7. P. 135–156.
Gilyazev R. A., Turdakov D. Yu. Active learning and crowdsourcing : a review of data markup optimization methods // Proceedings of the ISP RAS. 2018. Vol. 30, issue. 2. P. 215–250.
Global Atlas of Artifi cial Intelligence regulation. Vector BRICS / E. O.Vasin, A. D.Gvozdyreva, A. P. Deineka [et al.] ; ed. by A. V. Neznamov. 3rd ed., revised and add. Access from the legal reference system «ConsultantPlus». The state, society and personality : ways to overcome challenges and threats in the information sphere : a monograph / N. S. Volkova, A. A. Efremov, S. M. Zyryanov [et al.] ; ed. by L. K. Tereshchenko. Moscow : Infotropik Media, 2024. 352 p.
Mcafee E., Brynjolfson E. Car, platform, crowd. Our digital Future. Moscow, 2019. 368 p.
Nazarov N. A. Data quality assurance in automated decision-making in public administration // Journal of Russian Law. 2024. No. 5. P. 140–155.
Tereshchenko L. K. The legal regime of information. Moscow : Jurisprudence, 2007. 192 p.
Kharitonova Yu. S., Savina V. S., Panini F. Bias of artificial intelligence algorithms : issues of ethics and law // Bulletin of Perm. un-ta. Legal sciences. 2021. No. 3. P. 488–515.
Chaika M. A practical approach to the validation of rating models in the implementation of the PVR approach : the 5×5 methodology // Risk management in a credit institution. 2024. No. 1. P. 19–34.
Braun D. I beg to difer: how disagreement is handled in the annotation of legal machine learning data sets // Artifcial Intelligence and Law. 2024. No. 32. Р.839–862. URL: https://doi.org/10.1007/s10506-023-09369-4
Gray M., Savelka J., Oliver W., Ashley K. Can GPT Alleviate the Burden of Annotation? // Legal Knowledge and Information Systems. 2013. URL: https://www.researchgate.net/publication/376422423_Can_GPT_ Alleviate_the_Burden_of_Annotation
Subinay A, Procheta S., Dwaipayan R., Kripabandhu Gh. A case study for automated attribute extraction from legal documents using large language models // Artifi cial Intelligence and Law. 2024. November.








