知識(shí)產(chǎn)權(quán)全產(chǎn)業(yè)鏈一站式服務(wù) · 注冊(cè) · 管理 · 維權(quán) · 認(rèn)證 · 項(xiàng)目

專(zhuān)利文獻(xiàn)翻譯領(lǐng)域的“狼”來(lái)了?

來(lái)源:本站原創(chuàng)  時(shí)間:2019年11月08日

人工智能翻譯系統(tǒng)科專(zhuān)笑飛或?qū)⑹箤?zhuān)利文獻(xiàn)翻譯行業(yè)重新洗牌

  “狼,真的來(lái)了!”當(dāng)人工智能應(yīng)用浪潮襲來(lái)時(shí),知識(shí)產(chǎn)權(quán)出版社有限責(zé)任公司(下稱(chēng)知識(shí)產(chǎn)權(quán)出版社)董事長(zhǎng)諸敏剛對(duì)此作出如此評(píng)價(jià)。

  今年“4·26”世界知識(shí)產(chǎn)權(quán)日期間,知識(shí)產(chǎn)權(quán)出版社發(fā)布了一款被翻譯工作者稱(chēng)之為“狼來(lái)了”的人工智能產(chǎn)品——科專(zhuān)笑飛人工智能機(jī)器翻譯系統(tǒng)(下稱(chēng)科專(zhuān)笑飛),致力于為知識(shí)產(chǎn)權(quán)領(lǐng)域提供專(zhuān)業(yè)的專(zhuān)利文獻(xiàn)翻譯服務(wù)。該系統(tǒng)的上線(xiàn),不僅是響應(yīng)黨中央、國(guó)務(wù)院關(guān)于提升專(zhuān)利審查質(zhì)量要求的具體部署,也是落實(shí)國(guó)家知識(shí)產(chǎn)權(quán)局黨組要求運(yùn)用新技術(shù)推動(dòng)審查質(zhì)量提升的具體舉措。

  如今,經(jīng)過(guò)半年的推廣和實(shí)踐,科專(zhuān)笑飛的應(yīng)用效果如何?近日,諸敏剛在接受中國(guó)知識(shí)產(chǎn)權(quán)報(bào)記者采訪時(shí)坦言,市場(chǎng)反饋可謂是科專(zhuān)笑飛翻譯質(zhì)量好壞的“試金石”——科專(zhuān)笑飛的BLEU值(國(guó)際上評(píng)價(jià)機(jī)器翻譯質(zhì)量的一種經(jīng)典方法)已經(jīng)超越谷歌公司等多家行業(yè)巨頭;已有超過(guò)1500名審查員使用該系統(tǒng);已有10余家知識(shí)產(chǎn)權(quán)服務(wù)機(jī)構(gòu)和企業(yè)開(kāi)始使用,并有30余家明確表達(dá)了簽約意向……

  創(chuàng)新結(jié)碩果

  科專(zhuān)笑飛的成功問(wèn)世,是知識(shí)產(chǎn)權(quán)出版社在機(jī)器翻譯技術(shù)領(lǐng)域自主研發(fā)14年的成果。

  2005年,中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局與歐洲專(zhuān)利局談合作時(shí),對(duì)方提出,他們的審查員閱讀中文專(zhuān)利文獻(xiàn)非常困難,能否提供英文翻譯數(shù)據(jù)?在當(dāng)時(shí)的背景下,海量的專(zhuān)利文獻(xiàn)僅靠人工翻譯,成本高、效率低,因此,中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局開(kāi)始考慮研發(fā)一套專(zhuān)利文獻(xiàn)機(jī)器翻譯系統(tǒng),并將此重任交由知識(shí)產(chǎn)權(quán)出版社負(fù)責(zé)。

  無(wú)技術(shù)、無(wú)人才是知識(shí)產(chǎn)權(quán)出版社承接該任務(wù)后面臨的兩大困難。為此,知識(shí)產(chǎn)權(quán)出版社將機(jī)器翻譯列為當(dāng)年的重點(diǎn)研發(fā)項(xiàng)目,組建了一支由專(zhuān)家教授牽頭的機(jī)器翻譯專(zhuān)業(yè)研發(fā)團(tuán)隊(duì),開(kāi)啟了自主研發(fā)機(jī)器翻譯核心技術(shù)的艱辛發(fā)展之路。但在之后的很多年里,研發(fā)進(jìn)展并不順利,機(jī)器翻譯技術(shù)長(zhǎng)期落后于國(guó)際大公司。

  轉(zhuǎn)機(jī),出現(xiàn)在2011年,那一年,知識(shí)產(chǎn)權(quán)出版社從中國(guó)科學(xué)院計(jì)算機(jī)語(yǔ)言信息工程研究中心“挖”來(lái)了機(jī)器翻譯領(lǐng)域的頂級(jí)專(zhuān)家張孝飛,其在知識(shí)產(chǎn)權(quán)出版社科技文獻(xiàn)機(jī)器翻譯研究院(下稱(chēng)科技文獻(xiàn)機(jī)器翻譯研究院)成立后,擔(dān)任副院長(zhǎng),帶領(lǐng)研究團(tuán)隊(duì)不斷調(diào)整技術(shù)路線(xiàn)、完善技術(shù)方案,終于使科專(zhuān)笑飛的準(zhǔn)確率穩(wěn)定在了70%左右。

  “準(zhǔn)確率達(dá)不到80%,這套翻譯系統(tǒng)就沒(méi)有實(shí)用價(jià)值;達(dá)不到90%,就沒(méi)有市場(chǎng)競(jìng)爭(zhēng)力?!敝T敏剛的一席話(huà)給研發(fā)工作剛有起色的研發(fā)團(tuán)隊(duì)又潑了一身冷水。在技術(shù)攻關(guān)的關(guān)鍵時(shí)刻,擔(dān)任科技文獻(xiàn)機(jī)器翻譯研究院院長(zhǎng)的諸敏剛親自參與指導(dǎo)機(jī)器翻譯技術(shù)研發(fā),加強(qiáng)對(duì)機(jī)器翻譯的支持力度。

  既熟悉日語(yǔ)、英語(yǔ)、德語(yǔ)等多門(mén)語(yǔ)言,又了解專(zhuān)利申請(qǐng)文件的撰寫(xiě)方式,這使得諸敏剛很容易發(fā)現(xiàn)專(zhuān)利文獻(xiàn)翻譯的難點(diǎn)和痛點(diǎn)。為此,諸敏剛找出一些較難翻譯的專(zhuān)利文獻(xiàn),多次進(jìn)行試驗(yàn),發(fā)現(xiàn)問(wèn)題后,立即與研發(fā)人員進(jìn)行討論,并進(jìn)行改進(jìn)。經(jīng)過(guò)多次調(diào)整技術(shù)方案后,科專(zhuān)笑飛的準(zhǔn)確率終于達(dá)到了90%以上,并于今年“4·26”世界知識(shí)產(chǎn)權(quán)日期間正式發(fā)布。

  實(shí)踐見(jiàn)真章

  投入市場(chǎng)的科專(zhuān)笑飛究竟如何?兩組數(shù)字,彰顯效果:10秒鐘翻譯1萬(wàn)字;日漢雙向翻譯準(zhǔn)確率接近98%、英漢雙向翻譯準(zhǔn)確率接近95%、德漢雙向翻譯準(zhǔn)確率接近90%。

  “科專(zhuān)笑飛翻譯的專(zhuān)利文獻(xiàn)質(zhì)量已達(dá)到國(guó)際領(lǐng)先水平,可媲美人類(lèi)譯員?!钡靡嬗诳焖佟⒏咝У姆g結(jié)果,諸敏剛推廣科專(zhuān)笑飛的底氣十足,首先受益的便是國(guó)家知識(shí)產(chǎn)權(quán)局的專(zhuān)利審查員。截至目前,已有超過(guò)1500名審查員使用該系統(tǒng),累計(jì)翻譯次數(shù)超過(guò)5萬(wàn)人次。

  “翻譯得非常準(zhǔn)確。”在使用了科專(zhuān)笑飛之后,國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利局實(shí)用新型審查部審查員張祥作出如此評(píng)價(jià)。此前,張祥一直使用谷歌翻譯等工具,但由于操作流程復(fù)雜,導(dǎo)致翻譯時(shí)間成本較高。自今年5月開(kāi)始使用科專(zhuān)笑飛之后,張祥翻譯專(zhuān)利申請(qǐng)文件的效率明顯提升,翻譯完成后,無(wú)需看原文,便能快速理解專(zhuān)利申請(qǐng)文件內(nèi)容。

  除了審查員外,知識(shí)產(chǎn)權(quán)服務(wù)機(jī)構(gòu)和企業(yè)是科專(zhuān)笑飛的另一大使用群體。目前,知識(shí)產(chǎn)權(quán)出版社已與中國(guó)國(guó)際貿(mào)易促進(jìn)委員會(huì)專(zhuān)利商標(biāo)事務(wù)所(下稱(chēng)貿(mào)促會(huì)專(zhuān)商所)、商湯科技、法國(guó)Questel數(shù)據(jù)服務(wù)公司等10余家服務(wù)機(jī)構(gòu)及企業(yè)簽署了合作協(xié)議,并與美國(guó)高通公司、日本佳能公司等30余家企業(yè)達(dá)成明確簽約意向。

  “我們所大部分翻譯人員都配備了科專(zhuān)笑飛?!辟Q(mào)促會(huì)專(zhuān)商所訴訟與咨詢(xún)處副處長(zhǎng)王永剛在接受中國(guó)知識(shí)產(chǎn)權(quán)報(bào)記者采訪時(shí)表示,此前,他們使用的翻譯系統(tǒng)的通用翻譯質(zhì)量較高,但并非專(zhuān)注于某個(gè)技術(shù)領(lǐng)域,因此難以滿(mǎn)足專(zhuān)利申請(qǐng)文件的翻譯需求。

  “科專(zhuān)笑飛不僅能把專(zhuān)業(yè)性很強(qiáng)的詞匯翻譯得非常準(zhǔn)確,還能將句子翻譯得非常流暢,更符合專(zhuān)利文本的表述習(xí)慣。使用該系統(tǒng)翻譯后的譯文基本不需要進(jìn)行較大幅度的修改,便可直接使用。”王永剛表示,在翻譯過(guò)程中,能感覺(jué)到科專(zhuān)笑飛對(duì)系統(tǒng)和算法所進(jìn)行的優(yōu)化,使之更符合科技術(shù)語(yǔ)和技術(shù)文件的表達(dá)習(xí)慣。

  成績(jī)代表過(guò)往,創(chuàng)新仍在繼續(xù)。諸敏剛表示,未來(lái),知識(shí)產(chǎn)權(quán)出版社將不斷提高機(jī)器翻譯質(zhì)量,并繼續(xù)保持世界一流,打造具有國(guó)際競(jìng)爭(zhēng)力的品牌,為助力大專(zhuān)院校、科研人員閱讀理解專(zhuān)利文獻(xiàn),為審查員縮短審查周期、提高審查效率做出貢獻(xiàn),為國(guó)家知識(shí)產(chǎn)權(quán)事業(yè)發(fā)展做出貢獻(xiàn)。

  “準(zhǔn)確率要達(dá)到99.99%”,這是諸敏剛給科專(zhuān)笑飛研發(fā)團(tuán)隊(duì)定下的新目標(biāo),如他所言,科專(zhuān)笑飛的未來(lái)值得期許。(知識(shí)產(chǎn)權(quán)報(bào) 記者 馮飛)