Выбор начальных значений для итерационной аппроксимации хроматографических пиков экспоненциально модифицированной гауссианой

  • Михаил Дмитриевич Хрисанфов Московский государственный университет имени М.В. Ломоносова, Химический факультет, Москва, Институт физической химии и электрохимии им. А.Н. Фрумкина РАН, Москва, Россия
  • Андрей Сергеевич Самохин Московский государственный университет имени М.В. Ломоносова, Химический факультет, Москва, Институт физической химии и электрохимии им. А.Н. Фрумкина РАН, Москва, Россия
Ключевые слова: форма хроматографического пика, экспоненциально модифицированная гауссиана, ЭМГ, газовая хроматография, ГХ, жидкостная хроматография, ВЭЖХ

Аннотация

Для описания формы хроматографического пика используют различные математические функции, часть из которых основаны на функции нормального распределения: экспоненциально-модифицированная гауссиана, полиномиально-модифицированная гауссиана, гауссиана с параболической дисперсией и другие. Эти функции задаются 4-9 параметрами, которые подбираются итерационно в процессе нелинейной оптимизации. В случае низкой вычислительной устойчивости (характерной для большинства таких функций) выбор начального приближения существенно влияет на сходимость и возможность получения адекватного результата при проведении аппроксимации. Известные подходы к нахождению начальных приближений основаны на использовании эмпирических уравнений, связывающих параметры функций с базовыми параметрами хроматографического пика (коэффициент асимметрии, ширина пика на 10% высоты). При этом описанию алгоритмов расчета этих базовых параметров уделяется недостаточно внимания.

Для моделирования формы пика использовали экспоненциально-модифицированную гауссиану из-за ее широкого применения в хроматографии. В работе рассмотрели реализации этой математической функции, доступные в популярных библиотеках языка Python. Обнаружено, что реализация функции из библиотеки SciPy может обладать численной нестабильностью в случае симметричных пиков. Показано, что подход к расчету экспоненциально-модифицированной гауссианы, предложенный Каламбетом и основанный на использовании нескольких уравнений в зависимости от формы пика, лишен этих недостатков.

Рассмотрены подходы к расчету базовых параметров формы для дискретных пиков. Предложены и описаны алгоритмы для расчета координат точки максимума пика, левой и правой полуширины и ширины пика на заданной высоте (от 10% до 50% от максимума пика).

Известно, что связь базовых параметров пика с параметрами экспоненциально-модифицированной гауссианы является нелинейной. Эмпирические уравнения, описывающие эти связи были предложены Фоли и Дорси в 1980-х. Для описания этих зависимостей нами предложено использовать интерполяцию сплайнами. Показано, что такой подход позволяет точнее описать зависимости и расширить диапазоны допустимых значений параметров. Расчеты сплайна можно провести единожды и сохранить опорные точки сплайна и коэффициенты для дальнейшего использования.

В большинстве работ и методических документах ширина и полуширины хроматографического пика рассчитываются на высоте 10%. Нами рассмотрены альтернативные значения в диапазоне от 10% до 50% высоты пика. Показано, что для пиков без шума расчет ширины и полуширин можно проводить в относительно широком диапазоне высот (от 10 до 30%) без существенного влияния на рассчитанные из них значения параметров экспоненциально-модифицированной гауссианы. Для пиков с отношением сигнал/шум 100 можно использовать 30-35% высоты пика как альтернативный вариант для расчетов.

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Михаил Дмитриевич Хрисанфов, Московский государственный университет имени М.В. Ломоносова, Химический факультет, Москва, Институт физической химии и электрохимии им. А.Н. Фрумкина РАН, Москва, Россия

аспирант кафедры аналитической химии химического факультета Московского государственного университета им. М.В. Ломоносова, м.н.с лаборатории “умных” методов химического анализа Института физической химии и электрохимии им. А.Н. Фрумкина РАН, Москва, Россия

Андрей Сергеевич Самохин, Московский государственный университет имени М.В. Ломоносова, Химический факультет, Москва, Институт физической химии и электрохимии им. А.Н. Фрумкина РАН, Москва, Россия

к.х.н, м.н.с. лаборатории масс-спектрометрии химического факультета МГУ им. М.В. Ломоносова, м.н.с лаборатории “умных” методов химического анализа Института физической химии и электрохимии им. А.Н. Фрумкина РАН, Москва, Россия

Литература

Di Marco V.B., Bombi G.G. Math-ematical functions for the representation of chromatographic peaks. Journal of Chro-matography A. 2001; 931(1-2): 1-30.

Grushka Eli. Characterization of exponentially modified Gaussian peaks in chromatography. Anal. Chem. American Chemical Society, 1972; 44(11): 1733-1738.

Torres-Lapasió J.R., Baeza-Baeza J.J., García-Alvarez-Coque M.C. A Model for the Description, Simulation, and De-convolution of Skewed Chromatographic Peaks. Anal. Chem. 1997; 69(18): 3822-3831.

Baeza-Baeza J.J., Garcı́a-Alvarez-Coque M.C. Prediction of peak shape as a function of retention in reversed-phase liq-uid chromatography. Journal of Chroma-tography A. 2004; 1022(1-2): 17-24.

Caballero R.D., Garcı́a-Alvarez-Coque M.C., Baeza-Baeza J.J. Parabolic-Lorentzian modified Gaussian model for describing and deconvolving chromato-graphic peaks. Journal of Chromatography A. 2002; 954(1-2): 59-76.

Baeza-Baeza J.J., Ortiz-Bolsico C., García-Álvarez-Coque M.C. New ap-proaches based on modified Gaussian mod-els for the prediction of chromatographic peaks. Analytica Chimica Acta. 2013; 758: 36-44.

Li J. Development and Evaluation of Flexible Empirical Peak Functions for Processing Chromatographic Peaks. Anal. Chem. 1997; 69(21): 4452-4462.

Li J. Comparison of the capability of peak functions in describing real chro-matographic peaks. Journal of Chromatog-raphy A. 2002; 952(1-2): 63-70.

Pap T.L., Pápai Zs. Application of a new mathematical function for describing chromatographic peaks. Journal of Chro-matography A. 2001; 930(1): 53-60.

Pápai Z., L. Pap T. Determination of chromatographic peak parameters by non-linear curve fitting using statistical mo-ments. Analyst. Royal Society of Chemistry, 2002; 127(4): 494-498.

Foley J.P., Dorsey J.G. Equations for calculation of chromatographic figures of merit for ideal and skewed peaks. Anal. Chem. 1983; 55(4): 730-737.

Baeza-Baeza J.J., García-Alvarez-Coque M.C. Characterization of chromato-graphic peaks using the linearly modified Gaussian model. Comparison with the bi-Gaussian and the Foley and Dorsey ap-proaches. Journal of Chromatography A. 2017; 1515: 129-137.

Evaluating System Suitability - CE, GC, LC and A/D ChemStation - Revisions: A.03.0x-->A.08.0x.

Kalambet Y, Kozmin Y., Mikhai-lova K., Nagaev I., Tikhonov P. Recon-struction of chromatographic peaks using the exponentially modified Gaussian func-tion. J. Chemometrics. 2011; 25(7): 352-356.

Harris C.R., Harris C.R., Millman K.J., Van Der Walt S.J., Gommers R., Vir-tanen P., Cournapeau D., Wieser E., Taylor J., Berg S., Smith N.J., Kern R. Array pro-gramming with NumPy. Nature. Nature Publishing Group, 2020.; 585(7825): 357-362.

Virtanen P. et al. SciPy 1.0: funda-mental algorithms for scientific computing in Python. Nat Methods. Nature Publishing Group, 2020; 17(3): 261-272.

The pandas development team. pandas-dev/pandas: Pandas. Zenodo, 2024.

Hunter J.D. Matplotlib: A 2D Graphics Environment. Computing in Sci-ence & Engineering. 2007; 9(3): 90-95.

Waskom M.L. seaborn: statistical data visualization. Journal of Open Source Software. 2021; 6(60): 3021.

Granger B.E., Pérez F. Jupyter: Thinking and Storytelling With Code and Data. Computing in Science & Engineer-ing. 2021; 23(2): 7-14.

mkhrisanfov/peak-shape-calculation [Electronic resource]. URL: https://github.com/mkhrisanfov/peak-shape-calculation (accessed: 14.05.2024).

Zenkevich I.G., Makarov A.A., Pav-lovskii A.A. New approaches to the calcu-lation and interpretation of asymmetry fac-tors of chromatographic peaks. J Anal Chem. 2017; 72(7): 710-718.

Mallard W.G., Reed J. AMDIS – USER GUIDE. National Institute of Stand-ards and Technologies, 2019.

TensorFlow Developers. Tensor-Flow. Zenodo, 2024.

Samokhin A.S., Kalambet Yu.A. Opredelenie parametrov funkcii razvertki kvadrupol''nogo mass-spektrometra: 2. Analitika i kontrol'. 2018; 22(2): 168-176. (In Russ.)

Barber W.E., Carr P.W. Graphical method for obtaining retention time and number of theoretical plates from tailed chromatographic peaks. Anal. Chem. 1981; 53(12): 1939-1942.

Опубликован
2025-01-03
Как цитировать
Хрисанфов, М. Д., & Самохин, А. С. (2025). Выбор начальных значений для итерационной аппроксимации хроматографических пиков экспоненциально модифицированной гауссианой. Сорбционные и хроматографические процессы, 24(6), 885-895. https://doi.org/10.17308/sorpchrom.2024.24/12566