打造自主領先的密態數據庫產品——記南開大學計算機學院副院長、網絡空間安全學院副院長劉哲理
劉哲理
2022年6月28日,國家計算機病毒應急處理中心發布專題研究報告,披露美國國家安全局利用“酸狐貍平臺”正重點對中國和俄羅斯的政府機構、重要組織和信息基礎設施目標發起持續性攻擊,并實時向美國國家安全局總部傳送數據情報。“酸狐貍”事件以及當年震驚全球的斯諾登事件等不斷發出警告,數據泄露威脅國家安全,如不采用國產自主可控的數據安全技術、產品,整個國家將毫無隱私可言。
數據庫是信息的主要存儲介質,與操作系統、芯片一同成為現代信息技術領域的三大核心基礎。防止數據泄密,最關鍵是對數據進行加密。難題久攻不破,國外技術封鎖,密態數據庫研究成為相關科研人員自主創新的重要方向。研制密態數據庫的關鍵是解決密文查詢和密文計算問題,南開大學計算機學院副院長、網絡空間安全學院副院長劉哲理教授向重大難題發起挑戰。面向語義安全數據庫、茫然操作數據庫等世界性難題,劉哲理提出了算法,建立了模型,提供了有效方案,服務于國家重大需求,為國產自主可控的密態數據庫產品的成功研制持續貢獻著智慧與力量。
與企業共成長
與企業合作,一直伴隨著劉哲理的科研歷程:博士時參與對日外包項目;在天津環球磁卡股份有限公司做博士后研究;與東港股份合作,成功研制基于信息安全技術的Java卡操作系統;與北京安華金和科技有限公司合作,繼2016年成立數據庫安全聯合實驗室之后,在2021年聯合共建數據安全與隱私計算聯合實驗室;與天津南大通用數據技術股份有限公司合作,開發的數據庫透明加密算法獲天津市科技進步獎二等獎。
隨國家、行業的需求而拓展,劉哲理的研究一直在深入。早在2018年,為解決數據共享流通的難題,劉哲理與騰訊合作,率先開展了密文集合交集運算的應用研究,讓隱私保護的密文數據共享成為現實,引領了聯合廣告精準推薦的產品新形態,為騰訊帶來年流水2億元、利潤近億元的收益。2020年,中央網信辦組織評審中國首屆十大數據安全典型實踐案例,劉哲理與騰訊聯合研制的“隱私保護的多平臺聯合廣告推薦業務”成功入選,成為唯一高校牽頭入選的案例,起到了引領示范的作用。
合作不僅為企業帶來了新的發展可能,更為劉哲理的科研向深處走積累了寶貴的經驗與動能。與華為的合作,就標志著劉哲理的科研邁入了深水區。
破世界級難題
在透明加密安全等級不夠高的背景下,2003年,語義安全作為基本的數據庫安全目標被提出。語義安全要求將相同的明文加密成不同的密文,即數據的“一次一密”。在明文上,數據庫可以通過數值相等來完成兩個列的連接查詢,但“一次一密”加密后相同的值不相等,大小順序也不再保持。如果客戶端不存狀態、客戶端和服務器不交互,很難實現密文上的查詢。
為解決相關問題,世界各地的科學家自2003年起就開展了一系列研究,但一直沒有找到無交互、低存儲、可應用到數據庫的語義安全的密文查詢方案,這些問題成為十余年懸而未決的技術難題,但就是這樣棘手的難題,卻被劉哲理在與華為的合作中破解了。相關成果也獲得了2022年度中國密碼學會密碼創新獎。
2019年,劉哲理受邀與華為開始聯合研制高斯數據庫,成為華為高斯數據庫安全(security)小組核心成員(唯一的非華為成員),全面參與密態高斯數據庫研制,致力于攻克密文查詢和密文計算的難題。2020年6月,華為數據庫OpenGauss開源,劉哲理團隊提供的密文等值查詢、范圍查詢和密鑰管理等方案被應用。兩年左右,OpenGauss數據庫被免費下載72萬套,也就意味著,72萬個信息系統完成了國外數據庫產品的國產化替代。
目前,高斯數據庫已推出12種商業發行版,取得了較大經濟和社會效益。劉哲理提出的語義安全的保留順序加密和可搜索加密算法、實用安全的揭序加密算法,面向數據庫密文查詢面臨的安全性和效率問題,有針對性地解決了無交互低存儲的語義安全密文范圍查詢、面向復雜查詢的無交互索引樹構建等一系列難題。成果已在華為數據庫落地商用,使華為的算法級語義安全密態數據庫產品走在了世界前列。這些研究也得到了包括中國科學院院士、加拿大皇家科學院院士、新加坡工程院院士、電子電氣工程師學會會士、美國計算機協會會士等在內的多名知名學者的肯定。
劉哲理(左一)與學生進行學術研討
服務國家戰略
近幾年數據庫廠商開始利用可信執行環境來研制云加密數據庫,但它們面臨模式泄露攻擊的風險,如何對訪問模式保護已經成為關鍵的科學問題。“加密數據還不足以保護數據隱私,如果攻擊者控制了服務器,它可以通過觀察哪些記錄被訪問來完成破解。茫然操作數據庫則要求采用茫然讀寫策略,讓攻擊者無法區分哪條記錄被訪問。”劉哲理介紹,研究高效茫然讀寫模型無疑是對訪問模式進行保護的一個有效策略。
茫然操作伴隨著大量虛假讀寫,與數據庫的高性能要求沖突,這成為高效茫然讀寫模型設計的巨大挑戰。經過深入探索,劉哲理構建了高效的輕量級客戶端的茫然讀寫策略。他的研究獲得業界學者的廣泛關注,美國計算機協會會士、數據庫期刊《國際大型數據庫期刊》(VldbJ)(美國VLDB基金會贊助)前主編伊恩·阿巴迪教授曾給出高度評價,更在信息安全會議計算機系統協會安全會議(USENIX Security)2022年的論文中,多次引用了劉哲理的多云ORAM方案。
這些成果在應用中,同樣獲得了佳績。基于異或操作的茫然算子在華為數據庫可信硬件訪問行為模式保護中應用,提升了系統的安全性,并在非開源和內部版本進行了集成。數據表明,千萬級數據的洗牌操作開銷由分鐘級降低為毫秒級,這表示茫然操作數據庫從設想到真正走向應用又前進了一大步。
談起我國密態數據庫研究的現狀,劉哲理坦言,目前我國雖然已經跟上了國外的研究步伐,并在密文算法方面取得了部分領先,但這僅僅是構建了密文查詢和密文計算的基本能力支撐,與分析型數據庫、事務處理、并發控制的深層融合還遠遠不夠。復雜密文查詢難題、存儲引擎讀寫優化難題、數據茫然高效存儲難題,都是影響我國自主可控密態數據庫技術走到世界前列的攔路虎。只有付出百倍努力,創新、求真、務實,才能克服這些難題。密態數據庫的研制才剛剛開始,任重而道遠。
但與華為合作,堅定了劉哲理向前邁步的信心。“能沉心靜氣去做大產品,華為的決心和投入是一般企業比不了的。OpenGauss并不賺錢,華為的目標不是為了賺錢,它要的是開源,去推動國產數據庫生態的形成,這是華為的戰略眼光。”與華為合作,劉哲理有這樣的體會。
雖與華為合作已攻克了一些算法級語義安全密文查詢的難題,但還有很多問題未得到解決,未來又是一個茫然操作數據庫的時代,有諸多難題需要去克服。“與華為合作已經3年,但我們的合作才剛剛開始,我們的目標很明確:提供高安全性的數據庫加密產品,服務于國家重點領域,將中國的密態數據庫做到世界領先。”面對挑戰,劉哲理始終目標堅定并充滿信心。
追求完美卓越
從事信息安全與密碼學研究的學者,無人不知在頂級會議、頂級刊物上發表文章的難度之大,但劉哲理卻成為以第一作者和通訊作者在信息安全領域頂會和頂刊、數據庫領域頂會和頂刊都發表論文的國內首個學者。從2013年開始投稿計算機和通信安全會議(ACM Conference on Computer and Communications Security,CCS),到近幾年十余篇中國計算機學會A類(CCF-A類)IEEE會刊論文,2021年第一篇USENIX安全研討會論文,再到近期一擊即中兩篇USENIX安全研討會和一篇VLDB論文,久經考驗、淬煉成鋼,劉哲理戰績頗豐。在網絡平臺“知乎”上,劉哲理曾將自己的經驗以一篇博文的形式分享給大家,僅發表兩天閱讀量就破了6萬。
劉哲理(右)在課堂間歇與學生交流
劉哲理坦言,和一開始就站在高起點上,一下子就能在頂會、頂刊成功發表論文的人不同,他的經歷有些特殊。平臺不高,科研底子薄,能取得令人不可思議的成績,靠的是勇攀高峰的信念和追求卓越的決心。
2011年,從天津環球磁卡股份有限公司博士后出站到南開大學工作時,劉哲理不在科研崗,而是在公共基礎教學部的教學崗,教的也不是信息安全系的學生。教學壓力大,但劉哲理從未放棄科研,沒有自己的學生,他一個人一步步走,直到2015年進入信息安全系,有了自己的學生,他的科研生涯才真正起步。
“科研上我是后來進步,但在教學上我一直沒落后。”劉哲理說。他是教育部寶鋼優秀教師,獲批天津市一流金課(已被推薦國家級金課)1門、天津市虛擬仿真建設項目1項、天津市課程思政示范教材1部,并以第一完成人獲得天津市教學成果獎特等獎(已被推薦國家級教學成果獎),獲得中國高等教育博覽會“校企合作、雙百計劃”典型案例,獲得中國計算機教育大會最佳論文獎,獲得全國密碼學與信息安全教學研討會優秀論文獎3次,為國家培養了大批安全領域的高層次人才。在南開大學畢業典禮上,2019屆碩士生李博曾這樣表達對劉哲理的感謝之情,她說:“習總書記說,一個人遇到好老師是一生的幸運。我幸運地遇到了這樣一位好老師,他就是我的導師——劉哲理教授。”
作為學生的引路人,劉哲理始終將教師教書育人的根本職責銘刻心間,一直密切關注課程講授的實際效果,不斷更新和改進授課形式,真正做到讓學生將知識學為所用、內化于心。實踐式教學是劉哲理上課的一大特點,他通過建設慕課和虛擬仿真實驗、實驗講解視頻和三維一體的線上、線下教學資源,形成了完備的實踐教學體系。他的課程也因為深入淺出的理論講授、豐富的動手實驗內容、直觀形象的原理辨析,深受學生喜愛,成為同學們口口相傳的“必修課”。
勇攀高峰、追求卓越是劉哲理一貫的行事風格。做教學,他要成為學生的領路人,引導他們胸懷錦繡、腹有乾坤,以赤誠之心奉獻社會。做科研,他要攻克世界級難題,把國產自主可控的密態數據庫做到世界前列。作為南開大學網絡空間安全學院副院長、網絡安全學科帶頭人,他要凝聚大家形成合力,一起去推動學科的發展,擴大學科的影響力。
劉哲理(右)耐心為學生做學術指導
賡續密碼情懷
近年來,南開大學網絡安全學科發展迅猛。2018年,學院剛成立時只有寥寥幾人,劉哲理雖然是副教授,但是被學校委以重任,擔任網絡空間安全學院副院長。現在,學院規模已逐漸壯大,劉哲理領銜拿到國家自然科學基金重點項目、國防科技創新重點項目、國家重點研發計劃課題,實現了南開大學工科副教授承擔重點項目的首個突破。大項目接踵而至,劉哲理帶領團隊作戰,大家斗志滿懷。
劉哲理說,作為南開人,理應有信心去達成這些目標,因為南開人本身就肩負著這樣的使命。南開大學是國內首批密碼專業的獲批點,杰出校友周恩來總理創制了中國共產黨首部密碼“豪密”,原副校長胡國定是國內信息論的創始人,數學學院的首任院長沈世鎰先生是國內密碼編碼領域的創始人……在推動網絡安全學科建設與發展的同時,劉哲理也帶領大家梳理挖掘植根南開精神深處的密碼基因與情懷。
為將這種精神力量傳遞下去,劉哲理主導了以豪密為主題的密碼科普基地的建設并獲批天津市科普基地,承辦了全國大學生信息安全競賽創新實踐賽、第一屆和第二屆全國密碼科普知識競賽,組織了全國信息安全和密碼學教學研討會,組織了天津市“第五空間”智能安全大賽等……這些活動同時也擴大了南開大學密碼學科的影響力。在2022年軟科學科排名中,南開大學密碼科學技術專業獲得A+的好成績,是對劉哲理所做工作的肯定。但劉哲理深知,傳承老一輩留下的寶貴財富,唯有百折不撓、奮勇克難,才能用更優異的成績賡續南開的密碼情懷。