作為由人類自身創(chuàng)造的符號(hào),自然語(yǔ)言理解一直是機(jī)器學(xué)習(xí)界不斷研究的方向。自然語(yǔ)言理解使用了大量編譯原理相關(guān)的技術(shù),例如詞法分析、語(yǔ)法分析等。然而,迄今為止的語(yǔ)法都限于分析一個(gè)孤立的句子,上下文關(guān)系和談話環(huán)境對(duì)句子的約束和影響導(dǎo)致的理解不準(zhǔn)確乃至錯(cuò)誤問(wèn)題經(jīng)常發(fā)生。
如何利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行自然語(yǔ)言的的深度理解,分析歧義、詞語(yǔ)省略、代詞所指、同一句話在不同場(chǎng)合或由不同的人說(shuō)出來(lái)所具有的具體含義等一直是科研院所和各大企業(yè)持續(xù)發(fā)力的方向。
2020年6月,在訓(xùn)練約2000億個(gè)單詞、燒掉幾千萬(wàn)美元后,馬斯克OpenAI推出的強(qiáng)大AI模型——GPT-3一炮而紅。全球數(shù)以萬(wàn)計(jì)的開(kāi)發(fā)人員正在基于該平臺(tái)開(kāi)展工作,并廣泛應(yīng)用于電子郵件助理、語(yǔ)言翻譯、文檔檢索、游戲等領(lǐng)域。
與此同時(shí),云創(chuàng)大數(shù)據(jù)也在自然語(yǔ)言理解領(lǐng)域進(jìn)行創(chuàng)新,基于高性能人工智能數(shù)據(jù)處理一體機(jī)(云創(chuàng)研發(fā)的高維向量計(jì)算機(jī))提供的強(qiáng)大算力,開(kāi)發(fā)了語(yǔ)義搜索技術(shù)。高維向量計(jì)算機(jī)擁有60個(gè)處理單元,比對(duì)快捷,一秒鐘可做7億次比對(duì),成本降低10倍以上。本機(jī)作為主流的人工智能識(shí)別算法后段的比對(duì)專用機(jī),與各家算法兼容。憑借以上優(yōu)勢(shì),該產(chǎn)品自推出以來(lái)便獲得了不俗評(píng)價(jià)。
高維向量計(jì)算機(jī)
語(yǔ)義搜索技術(shù)應(yīng)用語(yǔ)義理解而非關(guān)鍵詞匹配的方法快速查找出需要搜索的內(nèi)容,在0.1秒內(nèi)即可返回結(jié)果,可廣泛應(yīng)用于專利搜索、電子病歷檢索、論文檢索、論文查重、資料搜索、法律文獻(xiàn)檢索等多種場(chǎng)景中。
語(yǔ)義球
● 專利搜索場(chǎng)景。利用語(yǔ)義搜索技術(shù),可以準(zhǔn)確查找到其他企事業(yè)單位已經(jīng)成功申請(qǐng)專利的描述、編號(hào)等信息,方便在專利申請(qǐng)時(shí)避免重復(fù)申請(qǐng)等相關(guān)問(wèn)題。
● 電子病歷檢索場(chǎng)景。針對(duì)醫(yī)學(xué)知識(shí)圖譜中關(guān)鍵技術(shù)進(jìn)行研究,形成了面向特定醫(yī)療領(lǐng)域的知識(shí)服務(wù)平臺(tái),可應(yīng)用于電子病例檢索、處方開(kāi)具、醫(yī)療知識(shí)問(wèn)答等醫(yī)療服務(wù)中。
醫(yī)療知識(shí)圖譜
醫(yī)療知識(shí)問(wèn)答系統(tǒng)
● 論文檢索場(chǎng)景。查閱論文時(shí),檢索的結(jié)果往往雖多,但不符合個(gè)人所需。借助語(yǔ)義搜索技術(shù),只需簡(jiǎn)單描述一句話,即可準(zhǔn)確檢索到用戶需要且有參考價(jià)值的論文。
● 論文查重場(chǎng)景。針對(duì)論文寫(xiě)作時(shí)將抄襲的中文論文先翻譯成英語(yǔ),再翻譯成中文,或者是采用替換詞語(yǔ)、改變表達(dá)的方式等規(guī)避查重等問(wèn)題。借助語(yǔ)義搜索技術(shù),可以對(duì)其進(jìn)行準(zhǔn)確檢測(cè),發(fā)現(xiàn)論文寫(xiě)作時(shí)的抄襲、剽竊亂象。
● 資料搜索場(chǎng)景。與論文搜索場(chǎng)景類似,通過(guò)語(yǔ)義搜索技術(shù),只需簡(jiǎn)短的一句話,即可實(shí)現(xiàn)對(duì)資料的搜索,且命中率和準(zhǔn)確率很高。
● 法律文獻(xiàn)檢索場(chǎng)景。語(yǔ)義搜索技術(shù)通過(guò)對(duì)歷史上相似案件詳細(xì)信息的查詢和梳理,可便于律師開(kāi)展有效辯護(hù),司法人員開(kāi)展高效工作等。
歡迎不同場(chǎng)景的用戶單位與我們聯(lián)系!如有合作意向,請(qǐng)聯(lián)系:
15722710158(李先生,微信同號(hào))