在線少兒英語培訓(xùn)想AI+,恐怕沒那么容易
![](http://image.woshipm.com/wp-files/img/35.jpg)
人工智能技術(shù)在線英語培訓(xùn)領(lǐng)域的應(yīng)用,還有很長(zhǎng)的路要走。
如今人工智能大行其道,各行各業(yè)都想貼上AI的標(biāo)簽,在線教育也是,各大公司都在凹出不同造型來和人工智能掛上鉤,以搶占市場(chǎng)先機(jī),贏得口碑與利潤(rùn)。然而,理想很豐滿,現(xiàn)實(shí)很骨感。作為人工智能+的應(yīng)用行業(yè),盡管人工智能在在線少兒英語培訓(xùn)領(lǐng)域已經(jīng)被應(yīng)用在個(gè)性化教學(xué)、智能師生匹配、情緒識(shí)別、智能互動(dòng)課堂、智能語音識(shí)別等,但智能相對(duì)論(微信id:aixdlun)仍然想提醒,這需要教育公司擁有強(qiáng)大的技術(shù)及研發(fā)實(shí)力的保障,然而這種實(shí)力并不是一蹴而就的,超高的門檻限制了教育公司引入人工智能的計(jì)劃。
先天不足——英語培訓(xùn)相關(guān)大數(shù)據(jù)難獲取
人工智能必須的養(yǎng)料——海量的、有效的數(shù)據(jù)難獲取。教育公司得有足夠的數(shù)據(jù)支撐人工智能深度學(xué)習(xí)的需要,包括英語知識(shí)大數(shù)據(jù)、語音數(shù)據(jù)、視頻數(shù)據(jù)、學(xué)生行為數(shù)據(jù)等。數(shù)據(jù)采集后,通過清洗得到有效數(shù)據(jù),然后根據(jù)教育公司學(xué)習(xí)系統(tǒng)要求,人工為圖片、視頻和語音內(nèi)容打標(biāo)簽、做標(biāo)記。標(biāo)注好的數(shù)據(jù)才可以用來訓(xùn)練人工智能算法模型,然后應(yīng)用到圖像識(shí)別、語音識(shí)別、動(dòng)作識(shí)別等不同的模塊。數(shù)據(jù)越準(zhǔn)確、數(shù)量越多,算法模型的效果就越好,產(chǎn)品的體驗(yàn)也會(huì)更近一步。
數(shù)據(jù)的規(guī)模和采集能力決定了人工智能在英語在線培訓(xùn)行業(yè)的發(fā)展速度。而在英語在線培訓(xùn)這個(gè)細(xì)分領(lǐng)域,21世紀(jì)出才開始出現(xiàn),2010年以后才逐漸成熟,不過短短幾年,且受限企業(yè)數(shù)據(jù)源相關(guān)設(shè)備影響,以及企業(yè)本身的對(duì)這類數(shù)據(jù)的關(guān)注度及科學(xué)技術(shù)的發(fā)展預(yù)見有限,原始數(shù)據(jù)積累本就不足,加之精細(xì)度不足,大規(guī)模的樣本數(shù)據(jù)較難獲取,更別談數(shù)據(jù)的有效性和其標(biāo)注的質(zhì)量。
差強(qiáng)人意——用于評(píng)估學(xué)生英語水平的數(shù)據(jù)分類不合理
數(shù)據(jù)的分類與關(guān)聯(lián),關(guān)乎系統(tǒng)最終實(shí)現(xiàn)的效果。目前在線教育公司的分類,無論是個(gè)性化學(xué)習(xí)還是智能語音測(cè)評(píng),都在粗分類的基礎(chǔ)上實(shí)現(xiàn)的。如有教育公司采用CCSS教材(Common Core State Standards 簡(jiǎn)稱CCSS,又叫美國(guó)共同核心州立教育標(biāo)準(zhǔn),是由美國(guó)教育部以及哈佛、哥倫比亞大學(xué)等名校提出的,按照美國(guó)大學(xué)招生要求制定的教學(xué)大綱),它涵蓋12年義務(wù)教育所有的學(xué)科內(nèi)容,所以當(dāng)使用人工智能技術(shù)評(píng)估學(xué)生的英語水平時(shí),其分類也只是按各年級(jí)水平粗分為12類,且不說用語評(píng)估的題目是否精確,僅以此作為學(xué)生的實(shí)際水平去給其制定學(xué)習(xí)路徑,未免有悖于千人千面的“個(gè)性化學(xué)習(xí)”的初衷。
數(shù)據(jù)挖掘和搜索算法對(duì)數(shù)據(jù)工廠中的知識(shí)庫和信息庫進(jìn)行分類與關(guān)聯(lián)的技術(shù)能力也是在線教育公司的一大痛點(diǎn)。數(shù)據(jù)存儲(chǔ)在硬盤上,機(jī)器想要找到某個(gè)數(shù)據(jù),必須一個(gè)個(gè)訪問過去,機(jī)器沒有分類的概念。如果需要機(jī)器理解用戶的語言,這種搜索技術(shù)也依然要機(jī)器的大腦配合才能達(dá)到,對(duì)每一個(gè)詞的定義應(yīng)該是一個(gè)庫,而這個(gè)庫中的每一個(gè)詞又都各自構(gòu)成庫,數(shù)據(jù)工廠所依托的搜索算法,就是在這么一個(gè)數(shù)據(jù)海洋中去為他們建立管理,然后去索引。數(shù)據(jù)工廠相當(dāng)于人腦中的記憶關(guān)聯(lián)過程:將某個(gè)詞同時(shí)與其他詞或是某個(gè)場(chǎng)景等等建立起動(dòng)態(tài)關(guān)聯(lián)的過程。這也是教育公司進(jìn)入AI+領(lǐng)域的重要門檻。
力不從心——學(xué)生情緒識(shí)別所依賴的智能算法遠(yuǎn)不夠智能
算法負(fù)責(zé)接收有關(guān)特定領(lǐng)域(例如學(xué)生掌握的所有英語單詞)的信息,通過對(duì)輸入的信息進(jìn)行權(quán)衡做出有用的預(yù)測(cè)(此人的英語水平)。通過實(shí)現(xiàn)讓“計(jì)算機(jī)自行學(xué)習(xí)的能力”,可以將優(yōu)化方面的任務(wù),交給算法負(fù)責(zé)。如對(duì)可用數(shù)據(jù)中的不同變量進(jìn)行權(quán)衡,進(jìn)而面向未來做出精確的預(yù)測(cè)。預(yù)測(cè)的準(zhǔn)確性一方面取決于上文提到的有效數(shù)據(jù)樣本量,另一方面取決于算法結(jié)構(gòu)。
如個(gè)別教育公司將人工智能深度學(xué)習(xí)算法用于情緒識(shí)別,通過人臉識(shí)別技術(shù),有效監(jiān)測(cè)學(xué)生的接受程度、喜好、專注度、開心值等,通過大數(shù)據(jù)來全程追溯學(xué)生的學(xué)習(xí)過程,發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的問題和喜好,進(jìn)行有針對(duì)性的強(qiáng)化和補(bǔ)充,從而讓學(xué)習(xí)效果更高效。情緒識(shí)別技術(shù)可以說是人工智能發(fā)展的最高水平,不論采用何種算法,目的都是讓人工智能具有和人類一樣的思維能力,可以分辨情感。
情感是人類神經(jīng)系統(tǒng)對(duì)外界價(jià)值關(guān)系產(chǎn)生的主觀反映。這種反饋由大腦首先發(fā)出指令,進(jìn)而影響人的面部表情、聲音高低和語速以及其他肢體語言,還會(huì)影響心臟、四肢等器官,也影響大腦本身。當(dāng)然,人的內(nèi)心狀態(tài)又與先天因素和成長(zhǎng)經(jīng)歷有關(guān),所以面對(duì)同樣的外部變化,不同的人會(huì)產(chǎn)生不同的情緒。 判斷情緒、看出眉眼高低,對(duì)于人類來說,可能連不會(huì)說話的小孩都能做到。可是,這個(gè)能力卻是目前人工智能的最高水平。也就是說,人工智能發(fā)展的水平還沒有足夠高,使機(jī)器人可以更像人。面對(duì)人類情感這個(gè)異常復(fù)雜且人類自身都沒有完全弄懂的問題,人工智能還有很長(zhǎng)的路要走。
所以在線教育公司提出的情緒識(shí)別,識(shí)別的精確度有待驗(yàn)證。而將這種不確定的預(yù)測(cè)結(jié)果應(yīng)用于學(xué)生的個(gè)性化學(xué)習(xí),為其制定獨(dú)有學(xué)習(xí)路徑或者提供任何的學(xué)習(xí)建議,難免會(huì)有人質(zhì)疑:前提都不一定正確,結(jié)果會(huì)對(duì)嗎?情緒識(shí)別只是教育公司AI應(yīng)用的冰山一角,其他類似的應(yīng)用都存在或大或小的問題。
一將難求——AI優(yōu)質(zhì)人才緊俏難得,教育公司鮮有優(yōu)勢(shì)
當(dāng)前,人工智能領(lǐng)域的競(jìng)爭(zhēng),主要體現(xiàn)為人才之爭(zhēng)。
只有投入更多的科研人員,不斷加強(qiáng)基礎(chǔ)研究,才會(huì)獲得更多的智能技術(shù)。人工智能技術(shù)的開發(fā)與應(yīng)用,不光需要依靠研發(fā)費(fèi)用和研發(fā)人員規(guī)模上的持續(xù)投入,還應(yīng)該加大基礎(chǔ)學(xué)科的人才培養(yǎng),尤其是算法和算力領(lǐng)域,而很多高校在很長(zhǎng)時(shí)間內(nèi)并沒有人工智能專業(yè)。這也就造成了國(guó)內(nèi)人工智能人才緊俏,各大互聯(lián)網(wǎng)公司的人才搶奪戰(zhàn)尤為突出。作為互聯(lián)網(wǎng)的一個(gè)細(xì)小分支,在線教育公司如沒有強(qiáng)大的綜合實(shí)力,很難獲得優(yōu)質(zhì)人才。
小結(jié)
人工智能技術(shù)在線英語培訓(xùn)領(lǐng)域的應(yīng)用還有很長(zhǎng)的路要走。在數(shù)據(jù)積累層面,未來,大數(shù)據(jù)時(shí)代來自全球的海量數(shù)據(jù)為人工智能在少兒英語在線培訓(xùn)的的應(yīng)用提供了良好的條件,在不久的將來將不成問題;人工智能的靈魂——智能算法還得依賴于人工智能技術(shù)的持續(xù)發(fā)展繼續(xù)優(yōu)化得到適用于英語在線培訓(xùn)的最優(yōu)算法;而人才,在線教育公司或許只有是行業(yè)領(lǐng)軍企業(yè)才有資格加入人工智能人才搶奪戰(zhàn),后來者唯有高薪聘請(qǐng)或文化吸引,才可能有一席之地。
作者:漠兮,微信公眾號(hào):智能相對(duì)論(ID:aixdlun),2個(gè)前人工智能行業(yè)管理咨詢老鳥+1個(gè)老媒體人組成的三人幫,深挖人工智能這口井,評(píng)出咸淡,講出黑白,道出深淺。
本文由 @漠兮 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Pexels,基于 CC0 協(xié)議
- 目前還沒評(píng)論,等你發(fā)揮!