造價工程師網絡教育-造價工程師網絡教育證書可以抵扣么
聲網教育行業負責人錢奮
作者 | 芥末堆 阿宅
大模型的角逐越來越激烈,縱觀大模型競技場上的選手,基本都是大廠。原因不難理解,大廠有充足的研發人才和資源,“彈藥”更充足。
在教育領域也是如此,在芥末堆主辦的GET2024·春大會上,學而思技術總監、MathGPT負責人白錦峰分享道,學而思做數學大模型的原因之一是,公司的技術研發和教研人員超3000人,研發經費也很高。“只有資源的大規模投入,才能保證將來的產出。”
這是否意味著沒有那么多研發資源的中小企業要在大模型的賽道上掉隊?作為底層實時音視頻技術服務商,聲網已經著手解決這個難題。
同時,近期多家教育企業相繼更新升級自家的學習機,智能教育硬件漸入AI時代,全面覆蓋啟蒙益智、自主輔學、學業提升等教學需求。一來一回對話、與家長進行音視頻溝通,都是學生與學習機的互動場景,這也是聲網能夠充分發揮自己優勢的領域。
緊跟教育行業的這些熱點與趨勢,聲網在GET大會·聲網教育沙龍專場,發布「RTC+AI教育超級雙擎解決方案」。據介紹,該解決方案旨在幫助開發者,通過這兩個引擎驅動在線教育模式、場景、體驗的創新與升級。
一直深耕音視頻互動領域的聲網為什么要將RTC和大熱的AI相結合?雙擎都帶來哪些新功能?將如何幫助教育客戶?
帶著這些疑問,芥末堆向聲網教育行業負責人錢奮尋求答案。
RTC(Real-Time Communication)是實時音視頻,是線上教學不可或缺的基礎設施;AI是近幾年大火的人工智能技術,正在越來越廣泛地應用于教育領域。聲網為什么要將兩種技術結合起來?
有需求,才有解決方案。一方面隨著GPT-4o、Astra等大模型的發布,RTC已慢慢成為大模型的關鍵能力,另一方面,在與教育客戶的直接且深度的溝通過程中,聲網感知到了最新的變化。
在實時音視頻領域,聲網當之無愧是佼佼者。數據顯示,在全球集成RTC能力的App中,50%以上都使用了聲網的技術,其中不僅有教育領域,還包括娛樂等領域。聲網的教育客戶中不乏國內外知名企業。
近兩年,聲網發現,新老客戶開始慢慢回歸線上大班課。究其原因,大班課是教學經濟效益和體驗效益最好的模型,處在辦學效益和學習效果綜合的平衡點上。然而,雖然客戶的預算變少了,但對效果的要求并沒有降低。他們既要大班課模式,又要小班課甚至1對1的教學體驗,簡而言之,既要花錢少,又要效果好,這無疑對聲網提出了更高的要求。
聲網觀察到的另一個趨勢是,智能教育硬件正在快速興起。根據IDC的數據,教育硬件以每年30%的增長率保持增長,學習機和辭典筆幾乎成為現在學生的標配。
另外,聲網發現,客戶對教育工具的要求和關注重點正在回到課堂上,課堂互動效果更受重視,比如老師的聲音能不能很輕松地傳遞到后排,噪音能否有效去除。
與此同時,生成式AI在教育領域的應用越來越普遍,很多廠商已經推出了AI概念的相關教學工具,包括AI教學陪練、教學和學情分析、備課等等。聲網相信自己在這個方向也可以有所作為。
站在當下這個節點,聲網在思考:從2014年創業以來,聲網已經為50%以上線上互動的教育機構提供音視頻服務。未來5至10年,聲網還應該為教育行業做些什么?
聲網思考的結果是繼續為線上線下教學客戶提供更優質的音視頻體驗,在追求體驗提升的基礎上,還要兼顧服務成本、辦學效益。這也是為什么聲網推出RTC+AI的教育雙引擎的概念。聲網希望,在雙擎的驅動下,教育創新的這輛汽車將行駛得更快。
RTC:支持多維直播,與主流學習機適配
據介紹,聲網在RTC方面主要升級了在線課堂教學體驗,包括超強互動、多維直播、絲滑流暢、教育硬件適配等新功能。
「絲滑流暢」自不必說,聲網的實時音視頻技術一直在追求實現超低延遲秒接入,此次的升級使體驗更優化,能確保每一堂課 0干擾、無卡頓。·
「超強互動」體現在技術和場景工具兩個方面。技術層面,新解決方案讓師生互動的延遲變得更加無感知;場景工具層面,僅僅是面對面的溝通還不夠,還需要一些工具來促進實時課堂的參與度,學生可隨時通過上麥、彈幕、文字消息與老師問答溝通,還能使用互動教學組件,包括搶紅包、搶答、投票等。
「多維直播」這個功能引發了芥末堆的好奇。聲網在介紹中提到,“「多維直播」支持實時直播和錄像直播兩種教學模式,錄像直播(偽直播)也能達到實時直播的教學效果;支持超級小班課模式,分組學習與線上雙師,打造‘大班課堂,小班體驗’”。
為什么錄播還要追求實時直播的效果?這種效果又是如何實現的?
錢奮解釋道,“雙減”后,教育公司為了節約成本,會錄制好課程再上傳到線上給學員觀看,這種情況在職教領域比較常見,因為成人可以自由把控自己的學習時間。具體功能上,「多維直播」支持客戶定制服務,比如學生看錄播課的時候,中間會跳出一道題目,答完題才能進入下面的環節。
在K12領域同樣有這樣的情況。比如,直播課的時間與學生的時間相沖突,通過「多維直播」,學生和家長可以選擇自己合適的時間來上錄播課,但能有直播的體驗。雖然是錄播課,但在聲網技術的加持下,老師也會提問,還有積分和發紅包環節。而且“偽直播”課并不是隨時都可以上,可以規定學生必須在某個時間段完成,比如這堂課是7:00-9:00,可以設置9點以后就不能打開。所以,對孩子來說,這就是在直播。聲網的技術也支持讓學生進入課堂之后自動分組,雖然對機構來說是大班課,但是學生的感受卻是小班課。
針對教育企業紛紛推出的學習機,聲網基于自己的優勢,也對學習機做了適配。因為學生除了可以通過學習機學習內容,還能觀看直播課、進行家校溝通、家長伴學,這些場景都需要實時音視頻技術的支持。
目前,聲網的解決方案全面適配市面上主流的學習機品牌,其優勢在于低端機型性能優化,低內存占用,極小包體、超低功耗,還支持全平臺入口加入課堂,行業內率先適配鴻蒙HarmonyOS NEXT。
乍一看,聲網與學習機似乎沒有關聯,其實不然。“我們疫情前就開始做了,之前字節跳動的大力臺燈也采用了聲網整體的方案,所以聲網對學習機的適配能力已經非常成熟了。”
關于如何將聲網的解決方案與學習機集成,錢奮介紹,硬件出廠的時候聲網就會把SDK嵌入進去,非常方便。
AI:讓課堂更沉浸,用大模型提升教學成效
AI這個引擎帶動的是AI沉浸課堂的打造和大模型輔助教學。
在處理音頻方面,聲網的智慧教室音頻(3A)解決方案具備AI降噪、AI去混響、AI回聲消除等能力,能讓課堂變得更加沉浸,深度還原線下教室的上課體驗。
錢奮提到,聲網的技術路線是從“連線”到“在線”再到“在場”,目前處于“在線”的階段,會繼續朝著“在場”前進。
2024年大模型應用大爆發,教育領域更是不斷被重塑,AI大模型與教育的結合已是大勢所趨。聲網了解到,很多客戶想嘗試大模型,比如說AI Tutor,這些場景與音視頻強相關,是聲網擅長的方向。
目前,市面上的一些語音助手的技術邏輯是把聽到的語音轉換成文字,使用文字回答后再轉換成語音回復給用戶,因此這類語音助手無法聽出語音中包含的情緒,存在延遲較高的問題。
OpenAI發布會上,用戶演示與GPT-4o的實時語音對話
OpenAI最新發布的GPT-4o讓語音視頻的交互能力再上一個臺階,用大模型進行更具真實感與沉浸感的實時語音正在成為現實,平均延時低至幾百毫秒,這無疑為包括聲網在內的RTC行業帶來很大的市場機遇,未來借助低延時、高音質的RTC技術,有望打造更極致的人與AI交互體驗。據了解,聲網也在利用新技術,研發更像真人的AI口語老師,不久將面世。
同時,聲網的技術還支持數字人AI助教,能實現7*24 小時的全天候陪伴輔導,隨時隨地答疑學生的課后難題。
聲網發布「RTC+AI教育超級雙擎解決方案」并不是一時興起,從一年前就已經開始布局。
錢奮表示:“實時音視頻與AI結合,我們一直在做,但需要一些客戶來驗證,經過驗證后,我們認為這個方案是成熟的,所以現在才發布。”
作為底層技術服務商,聲網的解決方案通常適用于各種規模的教育客戶,目前該解決方案的客戶包括多家頭部廠商,也有不少的中小企業。聲網觀察到,大企業和中小企業的需求有所不同。
錢奮解釋道,“考慮到自己的品牌和業務,大企業的需求會更定制化;中小企業可以直接用我們的解決方案,他們可以在跑通之后再做更多的定制化,投入更多資源。”
“我覺得這套解決方案對中小客戶更友好,因為不需要投很多的研發資源,也不需要那么長的研發周期。研發資源就是成本,研發周期是決定一家企業有沒有可能活下來的一個很重要的因素。”他說。
聲網主要為客戶提供完整的技術能力,聚焦穩定性、定制性和簡易性幾大原則。錢奮表示,聲網既為客戶提供聲網研發的模型,也提供市面上的通用大模型,由客戶自主選擇。“如果客戶認為通用大模型夠用,就不用再多加訓練;如果客戶希望做得更好,更垂直,還是需要用自己的數據進行訓練。”
“我們未來也可能會推出聚焦教育的小模型,小模型的體積包更小,更方便教育客戶接入。”錢奮透露。
今年是聲網成立十周年。截至目前,聲網在全球的活躍應用數已經超過74萬,全球數據中心超過250,單月通話分鐘數超過600億。這些數字還在持續增長。
能有如此成就,得益于聲網一直以來對市場動向的洞察,以及在技術能力上的深耕。此次發布的「RTC+AI教育超級雙擎解決方案」標志著,聲網在助力教育創新的道路上,往前又邁了一步。