圳南提示您:看後求收藏(第243章 資料工廠,網際網路2010,圳南,630看書),接著再看更方便。

請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。

路舟走後,陸銘回到了實驗室內。

他一邊走到後排,吩咐助手將新買的顯示卡拆出來安裝。顯得要老舊點的是他從住所搬過來的GTX280,而大多則是微訊的員工送過來的英偉達最新型號GTX580。

去年DanC.Ciresan發表的論文堪稱震驚世人。論文中採用了GTX280來處理數層的神經網路。而在此之前,神經網路的發展是一直苦於CPU的處理速度限制,而即便是要使用GPU,也得為特定的問題製作特定的演算法。

而說來讓陸銘覺得巧的是,路舟年前給他提這事還讓他頗為頭疼。但就僅僅幾天前,DanC.Ciresan新發布的論文提供了一種快速、可引數化的卷積神經網路,這可當真是瞌睡了來枕頭。

當然,對陸銘來講麻煩事自然也有,比如資料集的問題、實習生的水平問題、最終實際應用的問題。

而這些都得靠時間一點點解決。

陸銘想了想就笑了起來,他是沒多大心態變化,反而是更加期待這接下來的工作。

反正天大的事也不是他陸銘頂著,這背靠著小學弟他也就安心研究便是。

......

兩週後,夢谷雲低調上線了眾包平臺。

大多數關注到訊息的網民第一反應,“?!”

儘管眾包的模式並不算新鮮,但讓人感到新鮮的在於眾包中的專案。

夢谷眾包分了數個欄目:語音轉文字、圖片轉文字、圖片標註和分類、臉部照片和影片、腳部照片等。

前頭兩項按照提交的量計費,而後兩項則是一次計費。

有眼尖的網際網路從業者這就認出了這夢谷眾包模仿的是亞馬遜眾包。須知,著名的imageNet中就有大量來自亞馬遜眾包的資料集。

夢谷雲這是要搞事情啊?有沒這麼牛逼?

當然,外頭怎麼猜怎麼想是別人的事情。

一週後。

此時的路舟正在前往鄭市的飛機上。說來,這是他第一次去這城市。

路舟身邊是坐了夢谷推廣廣南分公司的經理周凱。身後的周達和王強東倒不是必要來的,不過是和周凱相熟一起合作所以也是跟了過來。

事情的倒也簡單,無非還是AI那點事,需要一些下游的公司來處理一些業務。

在陸銘的實驗室研究專案開始運轉後,路舟先是安排了微訊向海天瑞聲購買了一批語音庫供陸銘研究使用。

海天瑞聲是早在98年開始就做著語音標註的業務。路舟所買下的語音資料庫,裡頭的結構可以看成是一段語音對應一段文字。這樣的庫被廣泛地用於訓練AI,做語音識別或者轉換等領域。

至於這些庫的源頭?那自然是人工聽取再標註出文字資料。

而有語音標註,自然就也有圖片、影片。這些都被稱為資料標註。一個神經網路搭建後,需要用到的訓練資料便大多是來自於這裡頭。

夢谷雲上線眾包或者路舟這次來鄭市的目的也在於此,找人,認資料,練AI。

至於裨益,那簡直是全方位的。幾乎所有夢谷內的產品都能有所獲益。

“周凱。”

“老闆請講。”

路舟擺了擺手,“叫我路舟吧還是。說說,你是怎麼就這麼大膽公司剛上眾包一個月,你這就敢拉起工作室來搞的?”

周凱笑道,“那是老闆一直賞飯吃。作為公司一員,我可得時刻關注公司的產品狀況。這不眾包一上,我和他倆一合計覺得可以弄,這就直接安排了搞。

咱這省是華夏人也知道,人多嘿嘿,自然招工成本也是低的。”

路舟點頭,“那你們三人執行力也算挺強。”

周凱說道,“其實鄉里本就有做這行的,有所見聞我這上手也快。”

隨後路舟也不多問,畢竟具體還是要看了才知道狀況。

這資料標註的事情,說來是簡單,像周凱這樣無非就是找幾個能用電腦的就可以開始做。但往深了講,它也得有些注意。

好比人臉照片和影片,又或者是微訊內一些語音的後設資料,這多少都會涉及一些隱私和敏感。

若是周凱能做得來,管理得當,路舟自然不介意整體劃出部分給周凱做。而若是不能,那路舟也省得回頭出問題惹一身騷。

當然,這少不得還得專門開發些特定的系統給標註員使用。真考究起來也麻煩。找外包自然是可以,但這類事能抓在自己

本章未完,點選下一頁繼續閱讀。

遊戲小說相關閱讀More+

史上最強贅婿

晴天

納個妖師當相公

花千雪

隨身騷包系統

打倒一切

森醫生和他的工具人

禿毛喵喵

都市之召喚系統

墨魚之雨