咬文嚼紙提示您:看後求收藏(第60章 給詞語一個向量,學霸的黑科技時代,咬文嚼紙,630看書),接著再看更方便。
請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。
熟悉每一個句子的語境,然後整理出資料模型(模擬出漢語和英語等人類思維表達方式的模型)。
這些資料會幫助“詞向量”在不同的語境和語法中出現在合適的位置,如此翻譯會更加準確。
這項工作最大的難點就是編譯量非常大!
所以現今市面上現存的翻譯軟體都是採用語言學家總結的語法庫,即便有少部分軟體有自我學習功能,也不能做到了解和統計當今所有的語言習慣並對其作出分析。這也是現有翻譯軟體機械不智慧錯誤百出的原因。
剩下的一些介面,蕭銘將其接入全國各地的免費直播間,直播間主播有用普通話有用地方語言,也屬於口語的表達,最具有代表性。
盤古語言將蒐集各地的語音和語氣將其歸類編譯,最後形成語音資料庫和文字型檔相對應。
盤古程式設計使用方式很簡單,不需要輸入程式碼,只需要告訴邏輯意圖,當蕭銘告訴邏輯和方式之後,程式語言就可以明確執行。
然後……
然後計算機卡死了,卡得發燙!
蕭銘廢了半天功夫心血化為烏有。
勞資……
蕭銘購買的筆記本是華碩的普通筆記本,用的是iu處理器。
筆記本的處理器處理如此大量的資料,不卡死才怪!
蕭銘看了下時間,已經凌晨三點。
“我需要一組伺服器。”蕭銘說道,隨後他躺在床上繼續思考著語言翻譯和英語學習助手軟體的邏輯性問題。
接下來的幾天,蕭銘在學校很沉默。
除了做必要的數學和理綜練習題以外,大部分時間都在做英語閱讀和語文閱讀。
學校小組的成員都知道蕭銘在水木大學老師離開之後心情不怎麼好,都沒有去打擾他。
幾天之後,蕭銘問老爹要了十萬塊的經費,直接網購了四組英特爾XeonE5-2603v4晶片組建的伺服器主機,並且聯絡人上門安裝。又花錢開通了企業光纖專線。
蕭銘看著白花花的銀子今天時間就花沒了,也是肉痛。
兩個行業絕對是暴利!
一個是英特爾的晶片行業,一個是電信的通訊行業!
安裝伺服器的年輕師傅看著幾天沒睡好覺有些滄桑猥瑣的蕭銘,偷偷說道:“建直播網站?小兄弟,現在風聲緊,伺服器好還是租用海外的好點,自己建設風險大!”
蕭銘無語,“那你要不要先充個會員?可以一對一。”
師傅嘿嘿笑了兩聲說道:“不了不了。”
本章未完,點選下一頁繼續閱讀。