近日,南京審計(jì)大學(xué)統(tǒng)計(jì)與數(shù)據(jù)科學(xué)學(xué)院周興才教授團(tuán)隊(duì)(博士生楊光和碩士生鄭昊天)與加拿大阿爾伯塔大學(xué)孔令龍教授和東南大學(xué)曹進(jìn)徳院士合作完成的學(xué)術(shù)論文“FedFask: Fast Sketching Distributed PCA for Large-Scale Federated Data”在線(xiàn)發(fā)表于人工智能頂級(jí)期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)。該期刊科學(xué)引文索引影響因子為18.6,中科院分區(qū)一區(qū)頂級(jí)。研究成果主要聚焦于大尺度聯(lián)邦數(shù)據(jù)的統(tǒng)計(jì)機(jī)器學(xué)習(xí)基礎(chǔ)方法主成分分析(PCA)。作為最流行的線(xiàn)性降維工具之一,PCA能夠從原始數(shù)據(jù)中提取主要信息,同時(shí)過(guò)濾無(wú)關(guān)信息。該方法已廣泛應(yīng)用于機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、信息檢索、生物醫(yī)學(xué)和圖像處理等多個(gè)科學(xué)領(lǐng)域。當(dāng)數(shù)據(jù)特征維度超高時(shí),例如全基因組關(guān)聯(lián)分析(GWAS)中特征可達(dá)數(shù)十萬(wàn)至數(shù)百萬(wàn),這給傳統(tǒng)PCA方法帶來(lái)難以承受的通信負(fù)擔(dān)和計(jì)算復(fù)雜度。研究提出了一種新算法 FedFask(Fast Sketching for Feder
2025-12-04