在圖計(jì)算領(lǐng)域與人工智能的交匯處,方一向教授為計(jì)算機(jī)科學(xué)領(lǐng)域帶來(lái)了突破與革新。他與華為、字節(jié)跳動(dòng)等科技巨頭合作,將研究成果應(yīng)用于實(shí)際產(chǎn)業(yè)中,助力大模型精準(zhǔn)生成的新紀(jì)元;他在理論上革新了算法范式,實(shí)現(xiàn)了性能百萬(wàn)倍的提升,贏(yíng)得國(guó)際同行的廣泛贊譽(yù)。同時(shí),方一向教授是香港中文大學(xué)(深圳)程序設(shè)計(jì)競(jìng)賽隊(duì)的領(lǐng)航者,他指導(dǎo)的團(tuán)隊(duì)在國(guó)內(nèi)外賽場(chǎng)上大放異彩,屢創(chuàng)輝煌,成功培養(yǎng)了一批批計(jì)算機(jī)科學(xué)領(lǐng)域的未來(lái)之星。

?

與華為同行??助力大模型精準(zhǔn)生成新紀(jì)元

大語(yǔ)言模型已在眾多領(lǐng)域展現(xiàn)出令人矚目的能力,但它在處理特定領(lǐng)域查詢(xún)問(wèn)題時(shí)仍存在生成內(nèi)容不正確或“幻覺(jué)”、信息過(guò)時(shí)、缺乏專(zhuān)業(yè)領(lǐng)域知識(shí)、更新訓(xùn)練代價(jià)高等一系列問(wèn)題。為此,檢索增強(qiáng)生成(Retrieval Augmented Generation,下稱(chēng) RAG)技術(shù)應(yīng)運(yùn)而生,它通過(guò)引入外部知識(shí)圖譜檢索來(lái)指導(dǎo)大模型生成,從而大幅提升生成內(nèi)容的準(zhǔn)確性、可靠性、即時(shí)性。在這一背景下,方一向教授提出將知識(shí)圖譜稠密子圖搜索引入RAG技術(shù),并做了大量的基準(zhǔn)評(píng)測(cè)工作,提升了大模型回答問(wèn)題的準(zhǔn)確性、可靠性、時(shí)效性。

大模型檢索示例

方一向教授將這項(xiàng)研究成果應(yīng)用于解決國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展中的實(shí)際問(wèn)題,他與華為云PaaS-DevAI Lab緊密合作,為企業(yè)的生產(chǎn)研發(fā)提供了創(chuàng)新性的解決方案。此外,方一向教授還提出了知識(shí)圖譜構(gòu)建技術(shù),他主持的“面向研發(fā)數(shù)據(jù)的知識(shí)圖譜建構(gòu)技術(shù)研究”榮獲2022年度CCF-華為胡楊林基金-軟件工程專(zhuān)項(xiàng)基金資助。該項(xiàng)目從20多所高校與研究所的47項(xiàng)有效項(xiàng)目中脫穎而出,最終成為8項(xiàng)獲批項(xiàng)目之一。項(xiàng)目針對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等形式的研發(fā)數(shù)據(jù),通過(guò)實(shí)體和關(guān)系的識(shí)別、實(shí)體消歧和關(guān)系補(bǔ)全三個(gè)方面,為華為提供一整套的針對(duì)研發(fā)數(shù)據(jù)的知識(shí)圖譜構(gòu)建技術(shù)。

方一向教授團(tuán)隊(duì)與華為討論技術(shù)細(xì)節(jié)

?

攜手字節(jié)跳動(dòng) 探索社交網(wǎng)絡(luò)稠密子圖挖掘

使用圖建模業(yè)務(wù)場(chǎng)景并解決實(shí)際問(wèn)題在工業(yè)界越來(lái)越普及。作為圖數(shù)據(jù)中的重要組成部分,稠密子圖由一些緊密相連的節(jié)點(diǎn)所構(gòu)成,可以廣泛應(yīng)用于社交領(lǐng)域的社群發(fā)現(xiàn)、推薦領(lǐng)域的興趣圈層挖掘、風(fēng)控領(lǐng)域的異常團(tuán)伙挖掘等領(lǐng)域。然而,目前大部分稠密子圖挖掘相關(guān)工作專(zhuān)注于靜態(tài)圖數(shù)據(jù),難以適用于動(dòng)態(tài)網(wǎng)絡(luò),存在適用性差、準(zhǔn)確率不高、效率低等一系列問(wèn)題。在時(shí)序圖中,通過(guò)考慮數(shù)據(jù)的時(shí)序性,可以挖掘出更深層的動(dòng)態(tài)稠密子圖,以幫助企業(yè)追蹤感興趣的子圖結(jié)構(gòu)隨時(shí)間的演化情況。該技術(shù)可用于社交網(wǎng)絡(luò)分析與營(yíng)銷(xiāo),如優(yōu)化個(gè)性化推薦和識(shí)別異常行為?;谶@一背景,方一向教授和字節(jié)跳動(dòng)合作提出基于Leiden算法的高效動(dòng)態(tài)社區(qū)挖掘算法,可以快速地處理工業(yè)級(jí)大規(guī)模動(dòng)態(tài)圖數(shù)據(jù)(包含上億節(jié)點(diǎn)或邊的大規(guī)模圖),助力企業(yè)解決動(dòng)態(tài)社區(qū)挖掘難題。

?

革新最密子圖挖掘算法 性能提升百萬(wàn)倍

作為圖計(jì)算領(lǐng)域的經(jīng)典研究課題之一,最密子圖挖掘問(wèn)題已歷經(jīng)了近40年的研究歷程,其在異常檢測(cè)、社區(qū)檢測(cè)、圖可視化、圖索引構(gòu)造、生物網(wǎng)絡(luò)分析等眾多領(lǐng)域的廣泛應(yīng)用,始終吸引著學(xué)術(shù)界的高度關(guān)注。然而,該問(wèn)題的求解算法時(shí)間開(kāi)銷(xiāo)非常大,自1984年后鮮有重大突破,嚴(yán)重制約了最密子圖在大規(guī)模圖數(shù)據(jù)上的應(yīng)用。

方一向教授的研究為這個(gè)困局帶來(lái)了突破性的進(jìn)展,為提升最密子圖挖掘的效率,他創(chuàng)新性地提出一種基于k-core的全新求解范式。該范式通過(guò)推導(dǎo)k-core的密度理論上下界,把最密子圖鎖定在圖中特定的k-cores中,避免從全圖中求解最密子圖,大幅加速最密子圖挖掘的過(guò)程。基于這一新范式,方教授設(shè)計(jì)了針對(duì)有向圖的高效最密子圖挖掘算法,經(jīng)過(guò)大規(guī)模有向圖實(shí)驗(yàn)驗(yàn)證,新提出的算法較當(dāng)時(shí)最優(yōu)算法的性能提升高達(dá)6個(gè)數(shù)量級(jí)。這項(xiàng)突破性研究成果在數(shù)據(jù)庫(kù)頂級(jí)會(huì)議SIGMOD 2020上進(jìn)行發(fā)表,從458篇論文中脫穎而出,被評(píng)選為SIGMOD 2020會(huì)議的4篇最佳論文之一,并斬獲2021 ACM SIGMOD Research Highlight Award——數(shù)據(jù)庫(kù)領(lǐng)域的頂尖榮譽(yù)之一,代表了數(shù)據(jù)庫(kù)研究領(lǐng)域的最高水平。數(shù)據(jù)庫(kù)領(lǐng)域資深學(xué)者、ACM Fellow、IEEE Fellow、ACM杰出科學(xué)家陶宇飛教授高度評(píng)價(jià)此項(xiàng)成果,稱(chēng)其為“一項(xiàng)理論與實(shí)踐完美融合的出色研究”。

方一向教授斬獲2021 ACM SIGMOD Research Highlight Award

?

領(lǐng)航程序設(shè)計(jì)競(jìng)賽隊(duì)??全球賽場(chǎng)屢創(chuàng)輝煌

在精研學(xué)術(shù)與反哺產(chǎn)業(yè)之外,方一向教授作為港中大(深圳)程序設(shè)計(jì)競(jìng)賽隊(duì)的指導(dǎo)老師,帶領(lǐng)團(tuán)隊(duì)與全球頂尖高校的優(yōu)秀選手同場(chǎng)競(jìng)技,在激烈的競(jìng)爭(zhēng)中取得令人矚目的成績(jī)。2024年,方教授指導(dǎo)的團(tuán)隊(duì)斬獲12金2銀5銅的驕人成績(jī),并兩度入圍ICPC國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽世界總決賽。在第48屆ICPC世界總決賽中,團(tuán)隊(duì)以全球第40名、東亞區(qū)第8名的優(yōu)異成績(jī)刷新隊(duì)史成績(jī),解題數(shù)量與斯坦福大學(xué)、香港中文大學(xué)、上海交通大學(xué)等國(guó)內(nèi)外知名高校并列。截止至2024年年底,競(jìng)賽隊(duì)共計(jì)獲得31個(gè)金獎(jiǎng)、27個(gè)銀獎(jiǎng)、15個(gè)銅獎(jiǎng),充分體現(xiàn)了學(xué)校在培養(yǎng)國(guó)際化高素質(zhì)人才方面的卓越成果,彰顯了方教授及其團(tuán)隊(duì)日益增強(qiáng)的國(guó)際競(jìng)爭(zhēng)力。

港中大(深圳)3名隊(duì)員參加ICPC國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽世界總決賽

方一向教授不僅在競(jìng)賽指導(dǎo)上展現(xiàn)了卓越的能力,在競(jìng)賽平臺(tái)搭建、人才梯隊(duì)建設(shè)、本科生招生、企業(yè)合作銜接及基礎(chǔ)教育服務(wù)等方面同樣傾注了大量心血,還講授本科生《數(shù)據(jù)結(jié)構(gòu)》和博士生《算法分析》等人工智能核心基礎(chǔ)課程,致力于為學(xué)生打下堅(jiān)實(shí)的編程與算法基礎(chǔ),以培養(yǎng)其卓越的專(zhuān)業(yè)能力。方一向教授還帶領(lǐng)競(jìng)賽隊(duì)成功舉辦了2023年、2024年兩屆港中大(深圳)程序設(shè)計(jì)競(jìng)賽,積極推動(dòng)了編程競(jìng)賽在校園及附屬學(xué)校等大學(xué)輻射范圍內(nèi)的普及化和全民化,為人工智能領(lǐng)域的人才培養(yǎng)樹(shù)立了新的標(biāo)桿。

港中大(深圳)2023年程序設(shè)計(jì)競(jìng)賽隊(duì)員合影

?

競(jìng)賽或許可以不是目的本身,但通過(guò)一系列校內(nèi)外編程活動(dòng),像“全民乒乓球運(yùn)動(dòng)”一樣吸引全校大學(xué)生積極參與編程,能夠?qū)崿F(xiàn)“以賽促學(xué)”、“以賽促研”,以競(jìng)賽促進(jìn)計(jì)算機(jī)和人工智能教育水平的提高,幫助學(xué)生在學(xué)術(shù)研究、科技創(chuàng)新等路徑探索更多的人生可能性,這是方教授作為一名學(xué)者對(duì)后輩青年人的關(guān)切與支持。

青年教授簡(jiǎn)介

方一向,香港中文大學(xué)(深圳)數(shù)據(jù)科學(xué)學(xué)院副教授,香港中文大學(xué)(深圳)程序設(shè)計(jì)競(jìng)賽隊(duì)伍指導(dǎo)老師,主要研究大數(shù)據(jù)管理、挖掘、人工智能等相關(guān)課題,具體包括面向大規(guī)模圖數(shù)據(jù)的數(shù)據(jù)管理、數(shù)據(jù)挖掘、圖神經(jīng)網(wǎng)絡(luò)、表達(dá)學(xué)習(xí)等,以及大模型和圖數(shù)據(jù)結(jié)合的相關(guān)研究課題。在數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘、人工智能等領(lǐng)域的國(guó)際頂級(jí)會(huì)議/期刊(如VLDB、SIGMOD、ICDE、NeurIPS、WWW、AAAI、IJCAI、TODS、VLDBJ、TKDE等)上累計(jì)發(fā)表論文100余篇,包括中國(guó)計(jì)算機(jī)學(xué)會(huì)認(rèn)定的A類(lèi)論文(即CCF-A)將近70篇,第一/通訊作者CCF-A論文將近50篇。其中一項(xiàng)代表性研究成果的論文被評(píng)為SIGMOD 2020會(huì)議的最佳論文之一(~4/458),并榮獲2021 ACM SIGMOD Research Highlight Award。目前擔(dān)任國(guó)際知名期刊《Information Processing & Management》(CCF-B類(lèi)期刊)的編委,擔(dān)任多個(gè)數(shù)據(jù)庫(kù)和數(shù)據(jù)挖掘領(lǐng)域頂級(jí)會(huì)議(例如PVLDB、ICDE、KDD、AAAI、IJCAI等)的程序委員會(huì)成員以及頂級(jí)期刊(例如TKDE、VLDBJ等)的審稿人,中國(guó)計(jì)算機(jī)學(xué)會(huì)數(shù)據(jù)庫(kù)專(zhuān)業(yè)委員會(huì)的執(zhí)行委員。