百度擊敗微軟與Google AI自然語言理解摘冠
推薦語:百度在人工智能方面確實取得了巨大的進步,這體現在它的語音識別率更高、更準確,而在自動駕駛方面也居于行業領先地位,這次它能成功擊敗谷歌和微軟就證明了它在人工智能方面所擁有的技術優勢。
作者:DIGITIMES陳宜君

憑借中、英文之間的語言差異,國內搜尋引擎巨擘百度在一項人工智能(AI)自然語言處理競賽中,擊敗微軟(Microsoft)和全球搜尋引擎龍頭Google,奪得冠軍。
在自然語言理解的通用語言理解評估(General Language Understanding Evaluation;GLUE)基準與分析平臺上,百度的ERNIE模型獲得最高的90.1分,超越微軟的89.9分和Google的89.7分。
ERNIE模型最初是為理解中文語言而開發,不過百度研究人員很快就發現此模型也能更正確理解英語。
ERNIE是受Google用來訓練AI理解人類語言的BERT模型啟發而來。BERT是一種屏蔽式語言模型,會在給定的每份文本中遮隱15%的單詞,然后嘗試根據上下文進行預測。
不過許多漢字唯有與其他漢字組合在一起時,才會有明確的內在含意,這是中、英文的一項重要語言差異。百度團隊必須訓練其AI模型理解如何先隱藏一串有意義的漢字,再預測這些被遮隱的內容。
百度團隊在其原始碼代管平臺Github頁面上說明ERNIE所采用的技術時,以哈利波特(Harry Potter)是英國小說家羅琳(J. K. Rowling)所寫的系列奇幻小說,作為說明范例。
該說明指出,BERT模型能透過文本中同時出現的J、K和Rowling等單詞,確定K在這份文本中所代表的意思,卻無法學習和J. K. Rowling有關的任何知識;ERNIE則能透過分析單詞和實體所隱藏的知識,推論Harry Potter和J. K. Rowling之間的關系,進而推論Harry Potter是J. K. Rowling所寫的小說。
隨著百度算法開始能理解有意義的單詞,不再只是識別單一漢字后,ERNIE模型在中、英文理解上都有更好的表現。此后百度就將ERNIE應用于實際生活中,利用此AI模型提供更好的搜尋結果。人工智能促進協會(Association for the Advancement of Artificial Intelligence)曾在2019年2月的年會中,接受一篇以ERNIE模型為主題的報告在會上發表。
自Google在2010年退出國內后,國內搜尋引擎市場一直由百度獨霸,囊括70%的市占率。不過網際網絡使用模式的改變,讓百度的優勢開始松動。包括騰訊微信在內的自成一體超級應用程序(App)生態體系在中國崛起,意味民眾觀賞影片、閱讀新聞、在在線購物或下單美食外送時,都不必再仰賴傳統搜尋引擎。
此外,因短片App抖音風靡全球而崛起的字節跳動公司在2019年推出頭條搜索,在國內搜尋引擎市場掀起新一波競爭。字節跳動聲稱,正在打造一個通用搜尋引擎,以提供更理想的用戶體驗。
- 標簽:
- 編輯:李娜
- 相關文章