Persistent Homology for the Quantitative Analysis of the Structure and Stability of Carboranes①
Chen Donga Zhang Mingzhenga Chen Haibiaoa Xie Zuoweib Wei Guoweic,d,e② Pan Fenga②
a (School of Advanced Materials, Peking University Shenzhen Graduate School, Shenzhen 518055, China)
b (Department of Chemistry and State Key Laboratory of Synthetic Chemistry, The Chinese University of HongKong, Shatin, New Territories, Hong Kong, China)
c (Department of Mathematics, Michigan State University, MI, 48824, USA)
d (Department of Electircal and Computer Engineering, Michigan State University, MI 48824, USA)
e (Department of Biochemistry and Molecular Biology, Michigan State University, MI 48824, USA)
Chinese J. Struct. Chem.2020, 39(6), 999-1008
[背景介紹]
持續(xù)同調(diào)是量化結(jié)構(gòu)固有拓撲特征的一種強大而新穎的工具。本工作首次利用持續(xù)同調(diào)研究了存在多種元素的碳硼烷C2Bn-2Hn (n=5-20)及其父結(jié)構(gòu)BnHn2- (n=5-20)。所有這些結(jié)構(gòu)首先用標(biāo)準(zhǔn)Vitoris-Rips復(fù)合物進行分析。所有結(jié)構(gòu)都將可由拓撲指紋表示,拓撲指紋記錄了結(jié)構(gòu)細節(jié)。此外,利用拓撲指紋的平均持續(xù)長度建立了與結(jié)構(gòu)相對能量的線性回歸模型,構(gòu)建起持續(xù)同調(diào)特征與分子穩(wěn)定性之間的關(guān)系,分子穩(wěn)定性以相對能量表示。對于硼烷二價陰離子結(jié)構(gòu),由于B原子和H原子是成對的,所以我們只使用B原子集。以β0, β1 和 β2三種拓撲不變量的平均長度作為特征進行線性回歸,得到了與量子計算預(yù)測值之間良好的相關(guān)系數(shù)(0.977)。對于碳硼烷,我們考慮C-B原子集(忽略原子間的差異)、B原子集和C原子集分別得到了持久的同源特征(因為C2Bn-2Hn中只有兩個C原子,只考慮了β0這一拓撲不變量),并分別計算了7個拓撲特征的平均,最終得到與能量的相關(guān)系數(shù)為0.937。通過研究發(fā)現(xiàn),碳硼烷的穩(wěn)定性與H0、H1和H2中拓撲不變量生成的特征呈高度線性相關(guān)。結(jié)果表明,由持續(xù)同源生成的拓撲信息可以推廣并應(yīng)用于多元素體系。
[研究現(xiàn)狀]
持續(xù)同調(diào)(Persistent homology)是一種在變化的尺度中分析拓撲結(jié)構(gòu)的一種重要的方法?;舅枷胧请S著原子尺度的變化記錄結(jié)構(gòu)的拓撲不變量(例如β0, β1 和 β2),從而得到拓撲指紋(如圖1所示)。在此過程中,利用持續(xù)時間較長的拓撲特征來表征系統(tǒng)的內(nèi)在特性,而持續(xù)時間較短的拓撲特征可以作為系統(tǒng)的噪聲,通過預(yù)先設(shè)定的閾值進行過濾。在三維空間中,獨立組成(component)、環(huán)和腔是非常重要的拓撲特征。具有一定連接關(guān)系的結(jié)構(gòu)會產(chǎn)生在內(nèi)在不變的拓撲特征。本工作中將使用三個拓撲不變量,分別代表三維空間中獨立部件、環(huán)和腔的數(shù)量。同調(diào)是一種數(shù)學(xué)算子,它可以把一個結(jié)構(gòu)看成一個群,并得到這個群的拓撲不變量。持續(xù)同調(diào)則記錄了拓撲不變量的開始和結(jié)束,可以通過條形碼(barcode)進一步可視化,也稱為拓撲指紋。持久同源性作為一種有效而強大的工具,被廣泛應(yīng)用于圖像分析、復(fù)雜網(wǎng)絡(luò)、數(shù)據(jù)分析、幾何處理和計算生物學(xué)等領(lǐng)域。在化學(xué)中,利用持久同源,我們可以將高維空間中的材料結(jié)構(gòu)映射到低維拓撲空間,從而更方便地研究結(jié)構(gòu)與性能之間的關(guān)系。
圖1 類苯環(huán)結(jié)構(gòu)的拓撲指紋示意圖。
碳硼烷化合物,是一種穩(wěn)定的籠狀團簇化合物,通常可利用C(H)原子對替代一個或者多個氫硼化物中的B(H)原子對而得。其中,大量的實驗研究和理論研究圍繞著C2Bn-2Hn結(jié)構(gòu)展開。對于碳硼烷,其基本思想是結(jié)構(gòu)中的成鍵和非成鍵都可以用來估計軌道能量,結(jié)構(gòu)的相對穩(wěn)定性可以直接用相對能量來表示。在實際應(yīng)用中,我們首先利用之前的工作通過量子計算優(yōu)化出最穩(wěn)定的結(jié)構(gòu),得到每個結(jié)構(gòu)的單點能量,再構(gòu)造各結(jié)構(gòu)的相對能量。本篇工作首次將持續(xù)同調(diào)方法應(yīng)用于碳硼烷的結(jié)構(gòu)分析種。利用持久同調(diào)獲得結(jié)構(gòu)的拓撲不變量(Betti數(shù)),并生成拓撲指紋表示,并構(gòu)建了一個簡單的線性模型驗證拓撲特征與結(jié)構(gòu)的之間的關(guān)系。
圖2 (a) BnHn2- (n=5~20)的DFT計算的相對能量(eV)與拓撲持續(xù)同調(diào)擬合能量的結(jié)果比較。(b) 硼烷B5H52?, B6H62?, B7H72?,B9H92?, B11H112? 以及B12H122? (H不包括在內(nèi))的結(jié)構(gòu)。(c) C2Bn-2Hn (n=5~20)的DFT計算的相對能量(eV)與拓撲持續(xù)同調(diào)擬合能量的結(jié)果比較。(d) 碳硼烷C2B4H6, C2B8H10, C2B9H11, C2B10H12, C2B17H19和C2B18H20的結(jié)構(gòu)說明。
[結(jié)論和展望]
拓撲持續(xù)同調(diào)是一個強大的工具,通過變化的尺度定性分析結(jié)構(gòu)。本篇工作采用持續(xù)同調(diào)的方法分析了碳硼烷的結(jié)構(gòu)。通過對這些結(jié)構(gòu)的拓撲指紋的分析,我們可以建立基于拓撲不變量及其持久長度的模型。本研究采用拓撲不變量(β0, β1和β2)定量分析和預(yù)測了碳硼烷結(jié)構(gòu)以及其對應(yīng)BnHn2-的相對能量。通過利用拓撲不變量(β0, β1和β2)的平局長度特征,可以將該拓撲信息與BnHn2- (n = 5~20)的相對能量進行精確擬合,Pearson相關(guān)系數(shù)為0.977,而相應(yīng)的碳硼烷結(jié)構(gòu)C2Bn - 2Hn (n = 5~20)的Pearson相關(guān)系數(shù)為0.937。該工作以令人滿意的精度證明了持續(xù)同調(diào)方法應(yīng)用于多原子體系的的可行性,提供了一種新型的團簇結(jié)構(gòu)描述符。在未來的工作中,我們可以利用更有效的機器學(xué)習(xí)方法,根據(jù)持續(xù)同源得到的拓撲信息,建立結(jié)構(gòu)與性質(zhì)之間的關(guān)系,實現(xiàn)更大原子數(shù)量的碳硼烷結(jié)構(gòu)的預(yù)測。
文章鏈接:
Chen Dong, Zhang Mingzheng, Chen Haibiao, Xie Zuowei, Wei Guowei and Pan Feng. Persistent Homology for the Quantitative Analysis of the Structure and Stability of Carboranes, Chinese J. Struct. Chem. 2020, 39(6), 999-1008.
DOI: 10.14102/j.cnki.0254–5861.2011–2889
[團隊介紹]
謝作偉 個人簡介:
謝作偉,博士,金屬有機化學(xué)家,香港中文大學(xué)化學(xué)講席教授,中國科學(xué)院院士。主要從事碳硼烷、超級碳硼烷、金屬碳硼烷及硼化學(xué)的研究。提出并發(fā)展了過渡金屬催化的碳硼烷選擇性官能團化的系列方法,揭示了過渡金屬和碳硼烷籠原子間的成鍵特征和反應(yīng)規(guī)律。提出合成超級碳硼烷的理念,并建立了其制備方法,率先研究了超級碳硼烷化學(xué)。曾獲國家自然科學(xué)獎二等獎、中國化學(xué)會黃耀曾金屬有機化學(xué)獎、香港裘槎基金會優(yōu)秀學(xué)者獎等。
魏國衛(wèi) 個人簡介:
魏國衛(wèi),博士,密歇根州立大學(xué)數(shù)學(xué)系教授,電氣與計算機工程、生物化學(xué)與分子生物學(xué)兼職教授,博士生導(dǎo)師。研究領(lǐng)域包括數(shù)學(xué)分子生物科學(xué)和生物物理學(xué),生物醫(yī)學(xué)圖像和表面分析,以及人工智能在藥物設(shè)計,生物信息學(xué),定量系統(tǒng)藥理學(xué)和材料設(shè)計上的研究與應(yīng)用等。
潘鋒 個人介紹:
潘鋒,博士,北京大學(xué)教授,博士生導(dǎo)師,北京大學(xué)講席教授、北京大學(xué)深圳研究生院新材料學(xué)院創(chuàng)院院長。潘鋒教授已發(fā)表包括2篇《自然.納米技術(shù)》在內(nèi)的SCI代表性論文250余篇,其中影響因子10及以上和自然指數(shù)論文120余篇,3項國際發(fā)明專利和近80項國內(nèi)專利申請,授權(quán)發(fā)明專利27項。潘鋒教授目前聚焦探索基于圖論的結(jié)構(gòu)化學(xué)的新范式和新能源材料基因科學(xué)與工程,包括探索材料的結(jié)構(gòu)“基因”、材料高通量的計算、合成與檢測及數(shù)據(jù)庫等“材料基因組”工程及用于加速“清潔能源及關(guān)鍵材料研發(fā)”,包括新型太陽能電池、熱電發(fā)電、儲能和動力電池及關(guān)鍵材料的跨學(xué)科的基礎(chǔ)研究和應(yīng)用,具有十多年在國際大公司從原創(chuàng)基礎(chǔ)研究到創(chuàng)新產(chǎn)品產(chǎn)業(yè)化的經(jīng)歷 。