Выбор начальных значений для итерационной аппроксимации хроматографических пиков экспоненциально модифицированной гауссианой
Аннотация
Для описания формы хроматографического пика используют различные математические функции, часть из которых основаны на функции нормального распределения: экспоненциально-модифицированная гауссиана, полиномиально-модифицированная гауссиана, гауссиана с параболической дисперсией и другие. Эти функции задаются 4-9 параметрами, которые подбираются итерационно в процессе нелинейной оптимизации. В случае низкой вычислительной устойчивости (характерной для большинства таких функций) выбор начального приближения существенно влияет на сходимость и возможность получения адекватного результата при проведении аппроксимации. Известные подходы к нахождению начальных приближений основаны на использовании эмпирических уравнений, связывающих параметры функций с базовыми параметрами хроматографического пика (коэффициент асимметрии, ширина пика на 10% высоты). При этом описанию алгоритмов расчета этих базовых параметров уделяется недостаточно внимания.
Для моделирования формы пика использовали экспоненциально-модифицированную гауссиану из-за ее широкого применения в хроматографии. В работе рассмотрели реализации этой математической функции, доступные в популярных библиотеках языка Python. Обнаружено, что реализация функции из библиотеки SciPy может обладать численной нестабильностью в случае симметричных пиков. Показано, что подход к расчету экспоненциально-модифицированной гауссианы, предложенный Каламбетом и основанный на использовании нескольких уравнений в зависимости от формы пика, лишен этих недостатков.
Рассмотрены подходы к расчету базовых параметров формы для дискретных пиков. Предложены и описаны алгоритмы для расчета координат точки максимума пика, левой и правой полуширины и ширины пика на заданной высоте (от 10% до 50% от максимума пика).
Известно, что связь базовых параметров пика с параметрами экспоненциально-модифицированной гауссианы является нелинейной. Эмпирические уравнения, описывающие эти связи были предложены Фоли и Дорси в 1980-х. Для описания этих зависимостей нами предложено использовать интерполяцию сплайнами. Показано, что такой подход позволяет точнее описать зависимости и расширить диапазоны допустимых значений параметров. Расчеты сплайна можно провести единожды и сохранить опорные точки сплайна и коэффициенты для дальнейшего использования.
В большинстве работ и методических документах ширина и полуширины хроматографического пика рассчитываются на высоте 10%. Нами рассмотрены альтернативные значения в диапазоне от 10% до 50% высоты пика. Показано, что для пиков без шума расчет ширины и полуширин можно проводить в относительно широком диапазоне высот (от 10 до 30%) без существенного влияния на рассчитанные из них значения параметров экспоненциально-модифицированной гауссианы. Для пиков с отношением сигнал/шум 100 можно использовать 30-35% высоты пика как альтернативный вариант для расчетов.
Скачивания
Литература
Di Marco V.B., Bombi G.G. Math-ematical functions for the representation of chromatographic peaks. Journal of Chro-matography A. 2001; 931(1-2): 1-30.
Grushka Eli. Characterization of exponentially modified Gaussian peaks in chromatography. Anal. Chem. American Chemical Society, 1972; 44(11): 1733-1738.
Torres-Lapasió J.R., Baeza-Baeza J.J., García-Alvarez-Coque M.C. A Model for the Description, Simulation, and De-convolution of Skewed Chromatographic Peaks. Anal. Chem. 1997; 69(18): 3822-3831.
Baeza-Baeza J.J., Garcı́a-Alvarez-Coque M.C. Prediction of peak shape as a function of retention in reversed-phase liq-uid chromatography. Journal of Chroma-tography A. 2004; 1022(1-2): 17-24.
Caballero R.D., Garcı́a-Alvarez-Coque M.C., Baeza-Baeza J.J. Parabolic-Lorentzian modified Gaussian model for describing and deconvolving chromato-graphic peaks. Journal of Chromatography A. 2002; 954(1-2): 59-76.
Baeza-Baeza J.J., Ortiz-Bolsico C., García-Álvarez-Coque M.C. New ap-proaches based on modified Gaussian mod-els for the prediction of chromatographic peaks. Analytica Chimica Acta. 2013; 758: 36-44.
Li J. Development and Evaluation of Flexible Empirical Peak Functions for Processing Chromatographic Peaks. Anal. Chem. 1997; 69(21): 4452-4462.
Li J. Comparison of the capability of peak functions in describing real chro-matographic peaks. Journal of Chromatog-raphy A. 2002; 952(1-2): 63-70.
Pap T.L., Pápai Zs. Application of a new mathematical function for describing chromatographic peaks. Journal of Chro-matography A. 2001; 930(1): 53-60.
Pápai Z., L. Pap T. Determination of chromatographic peak parameters by non-linear curve fitting using statistical mo-ments. Analyst. Royal Society of Chemistry, 2002; 127(4): 494-498.
Foley J.P., Dorsey J.G. Equations for calculation of chromatographic figures of merit for ideal and skewed peaks. Anal. Chem. 1983; 55(4): 730-737.
Baeza-Baeza J.J., García-Alvarez-Coque M.C. Characterization of chromato-graphic peaks using the linearly modified Gaussian model. Comparison with the bi-Gaussian and the Foley and Dorsey ap-proaches. Journal of Chromatography A. 2017; 1515: 129-137.
Evaluating System Suitability - CE, GC, LC and A/D ChemStation - Revisions: A.03.0x-->A.08.0x.
Kalambet Y, Kozmin Y., Mikhai-lova K., Nagaev I., Tikhonov P. Recon-struction of chromatographic peaks using the exponentially modified Gaussian func-tion. J. Chemometrics. 2011; 25(7): 352-356.
Harris C.R., Harris C.R., Millman K.J., Van Der Walt S.J., Gommers R., Vir-tanen P., Cournapeau D., Wieser E., Taylor J., Berg S., Smith N.J., Kern R. Array pro-gramming with NumPy. Nature. Nature Publishing Group, 2020.; 585(7825): 357-362.
Virtanen P. et al. SciPy 1.0: funda-mental algorithms for scientific computing in Python. Nat Methods. Nature Publishing Group, 2020; 17(3): 261-272.
The pandas development team. pandas-dev/pandas: Pandas. Zenodo, 2024.
Hunter J.D. Matplotlib: A 2D Graphics Environment. Computing in Sci-ence & Engineering. 2007; 9(3): 90-95.
Waskom M.L. seaborn: statistical data visualization. Journal of Open Source Software. 2021; 6(60): 3021.
Granger B.E., Pérez F. Jupyter: Thinking and Storytelling With Code and Data. Computing in Science & Engineer-ing. 2021; 23(2): 7-14.
mkhrisanfov/peak-shape-calculation [Electronic resource]. URL: https://github.com/mkhrisanfov/peak-shape-calculation (accessed: 14.05.2024).
Zenkevich I.G., Makarov A.A., Pav-lovskii A.A. New approaches to the calcu-lation and interpretation of asymmetry fac-tors of chromatographic peaks. J Anal Chem. 2017; 72(7): 710-718.
Mallard W.G., Reed J. AMDIS – USER GUIDE. National Institute of Stand-ards and Technologies, 2019.
TensorFlow Developers. Tensor-Flow. Zenodo, 2024.
Samokhin A.S., Kalambet Yu.A. Opredelenie parametrov funkcii razvertki kvadrupol''nogo mass-spektrometra: 2. Analitika i kontrol'. 2018; 22(2): 168-176. (In Russ.)
Barber W.E., Carr P.W. Graphical method for obtaining retention time and number of theoretical plates from tailed chromatographic peaks. Anal. Chem. 1981; 53(12): 1939-1942.