- +1
兩個月股價暴漲超兩倍,海天瑞聲配得上AI基礎數據服務行業老二嗎?

海內外多家科技公司加碼人工智能,角逐聊天機器人賽道,ChatGPT概念股活躍的背后,AI訓練數據服務商海天瑞聲(688787.SH)進入大眾視野。
乘上ChatGPT概念快車,海天瑞聲兩個月股價暴漲超兩倍,被下發監管工作函,1月20日至2月21日,海天瑞聲累計共有4個交易日漲停。ChatGPT概念股并未一直保持沖高態勢,近日開始逐步回調。與此同時,海天瑞聲利空來襲,頻遭股東減持。
就海天瑞聲股價波動及具體業務布局,澎湃新聞記者近日曾多次以投資者身份致電海天瑞聲,相關負責人表示,公司沒有需要披露而未披露的重大事件。“和ChatGPT相關的自然語音處理,以往在我們公司總體業務中占到10%左右,具體占比要等2022年年報披露。它(ChatGPT)并沒有給公司帶來大量的訂單增加,我們的客戶還是比較穩定的,也有一些新客戶,但不是這個領域的。”
截至2月22日,海天瑞聲漲1.54%,報201.07元/股,總市值86億元。
實控人曾在中科院任職30年
從2月1日起,海天瑞聲共發布4次股票交易嚴重或異常波動的公告,海天瑞聲的實際控制人賀琳四次回函,稱其本人不存在處于籌劃階段的涉及公司的重大事項,在股票交易異常波動期間,其也不存在買賣海天瑞聲股票的情形。
賀琳是誰?時間回溯到2005年,當時北京海天瑞聲科技有限公司成立,注冊資本為30萬元,賀琳以貨幣出資了27萬元,現在的海天瑞聲就是由北京海天瑞聲科技有限公司變更設立。
在北京海天瑞聲科技有限公司設立初期,該公司從事的語音采集、標注業務,業務量還比較小,主要從事語音采集及利用業內公知、基礎的開源算法技術對采集的語音進行加工處理。隨著人工智能行業迅猛發展,行業對訓練數據開始產生較大的市場需求,2008年末,北京海天瑞聲科技有限公司核心技術人員郝玉峰、李科、唐滌飛先后加入,開始帶領研發業務人員逐步進行訓練數據生產的平臺工具、基礎研究、生產技術等方面的技術研發。
當時的賀琳未參與具體技術研發,其主要負責戰略、融資、外部關系等,而基于賀琳的人脈基礎,該公司開始為微軟等企業提供語音訓練數據服務,并在2009年至2012年期間與阿里、百度、騰訊、三星等大型科技公司建立了穩定的合作關系。
海天瑞聲的招股書披露,賀琳出生于1968年,畢業于北京大學,1987年至2017年7月任職于中國科學院聲學研究所,從事語音識別、語音合成、漢語語言理解、語音心理測試等方面的研究工作,先后參與了“漢語人-機語音對話系統工程”“漢語語音參數合成”等國家自然科學基金重點項目、國家八六三計劃智能計算機主題項目和中國科學院“八五”重大項目,完成《計算機漢語口語輸出系統的設計與實現》等論文十余篇,參與編寫《漢語語音合成-原理和技術》著作。
因為在中國科學院聲學研究所的就職經歷,當海天瑞聲2019年意在科創板上市時,曾有人質疑賀琳違反了中科院兼職規定,于在職期間創立北京海天瑞聲科技有限公司。海天瑞聲也被監管問詢,賀琳在任職中科院聲學研究所期間創辦海天瑞聲是否合規,以及由賀琳作為主要創作人的具體專利發明或著作權是否屬于中科院職務發明是否存在權屬糾紛等。
經過一番波折,海天瑞聲最終在2021年8月13日正式登陸上交所科創板,發行價格為36.94元/股。按照招股書所示,海天瑞聲的前10大股東中有2名自然人股東,一個是賀琳,另一個是唐滌飛。
上市一個月后,賀琳與丈夫蔡惠智在2021年9月簽訂《離婚協議書》并進行了相關財產分割。蔡惠智是中科海訊(300810.SZ)董事長,也曾在中國科學院聲學研究所任職。中科海訊是立足于海洋工程和水聲工程領域的高科技上市企業,專注于高性能信號處理平臺、聲納系統、仿真系統和大數據應用等產品的研制開發。根據離婚協議,蔡惠智將其持有的中科海訊1170萬股股票贈與他與賀琳的女兒蔡佳耘。
上市兩個月后,也就是2021年10月,海天瑞聲公布了唐滌飛的離職,公告稱其因個人原因不再擔任公司任何職務。唐滌飛自2022年9月開始減持海天瑞聲。截至2023年2月20日,唐滌飛及一致行動人中瑞立(員工持股平臺)已通過集中競價和大宗交易方式減持公司股份約128萬股,占公司股份總數的3%。其中,擬通過集中競價方式減持部分已減持完畢,減持總金額為7868.6萬元。
股東中有“國家隊”身影,曾戰略融資引入中國移動和中網投
根據海天瑞聲2022年第三季度財報,賀琳、北京中瑞安投資中心(有限合伙)、中移投資控股有限責任公司、唐滌飛和北京清德投資中心(有限合伙)是海天瑞聲前五大股東。前文中提到的中瑞立、中國互聯網投資基金管理有限公司-中國互聯網投資基金 (有限合伙)(簡稱:中網投)是其前10大股東。

來源:海天瑞聲2022年第三季度財報
海天瑞聲招股書披露,2019年12月,中網投與海天瑞聲、賀琳簽署《投資協議》,約定中網投以7998萬元的價格認購公司發行的129萬股新增股份,每股認購價格為62元,對應新增注冊資本129萬元。
據悉,中網投是數字經濟股權投資領域的國家隊。2017年,中國互聯網投資基金經國務院批準成立,由中央網信辦和財政部共同發起。該基金規劃總規模1000億元人民幣。
中國移動的全資子公司中移投資也是海天瑞聲的首發前股東之一,共持有海天瑞聲股份385.5萬股,占公司總股本的9.01%。當時海天瑞聲凈資產(股東全部權益)評估值為18.67億元。截至20日中移投資擬減持公告發出,海天瑞聲總市值達94億元,約為入股時估值的5倍。
此次中移投資計劃通過集中競價及大宗交易方式減持所持有公司股份合計不超過128.4萬股,合計不超過公司股份總數的3%。若以海天瑞聲20日的收盤價218.90元/股計算,中移投資合計減持的金額不超過2.81億元。
央企與“國家隊”基金入場,給海天瑞聲帶來了什么?在2021年12月的一份投資者關系活動記錄表中,海天瑞聲披露,公司2019年底通過戰略融資引入中國移動和中國互聯網投資基金,過往兩年中已經通過戰略協同安排,逐漸進入電信行業和網信安全行業,并借此代表行業與國家政策制定部門實現有效對接。未來,公司將繼續與兩方保持緊密戰略協同,助力公司業務不斷向電信、網安等政企領域拓展。
值得關注的是,除中移投資、唐滌飛及一致行動人中瑞立在減持海天瑞聲外,北京清德投資中心(有限合伙)在2022年10月26日至2023年2月15日期間,通過集中競價及大宗交易方式減持其持有的海天瑞聲股份40.5463萬股,占該公司股份總數的0.95%。
2023年2月2日至2023年2月21日,上海豐琬通過集中競價方式減持海天瑞聲42.8萬股,占公司股份總數的1.00%,減持總金額6364.9萬元。
凈利三年連降,與ChatGPT相關的自然語言業務占比12%
近二十年的發展與起起伏伏,海天瑞聲早已不是2005年剛成立時的模樣。
海天瑞聲方面人士告訴澎湃新聞記者,海天瑞聲如今已是數據服務行業的頭部企業,現有員工兩百多人,崗位多聚焦于技術方面,數據標注等工作則外包給供應商來做。“毛利高的業務是數據庫,開發一次,后面可以重復授權使用。”
海天瑞聲也曾披露,???就目前訓練數據產品的銷售情況看,平均生命周期大概在5年左右,有部分產品生命周期可達8-10年之久。一般來講,數據集產品在生產出來后,為了保證數據集自身的平衡程度,通常不會做大規模的更新、拓展,而是在標注類型方面做一些完善或者進行小規模的擴建調整。如果判斷有新的市場趨勢,公司會研發新的數據集去覆蓋。
從大行業來看,目前市場上數據服務市場主要由品牌數據服務商、企業自建團隊以及一些中小數據服務商構成。海天瑞聲的競爭對手仍是傳統模式下的數據服務公司,國內的主要競爭對手是一些品牌數據提供商,如慧聽、標貝以及一些新興公司,國外的主要競爭對手則是澳大利亞公司Appen。
根據海天瑞聲2022年半年報,目前在國內AI基礎數據服務行業中,海天瑞聲排名第二,市場占有率達12.9%。截至去年6月30日,海天瑞聲的客戶超700家,除阿里、百度、微軟、字節跳動等大型科技公司外,科大訊飛、商湯科技、云知聲、海康威視等人工智能企業,以及中國科學院、清華大學、中國科學技術大學等科研機構均是其客戶。
雖然海天瑞聲的客戶眾多,但受疫情影響,該公司近幾年的業績并不盡如人意。Wind數據顯示,2019年至2021年,海天瑞聲的營業收入逐年下降,分別為2.38億元、2.33億元和2.06億元;這三年該公司的凈利潤也經歷下滑,分別為8158.68萬元、8208.1萬元和3160.54萬元。
此外,根據海天瑞聲的預期,該公司2022年的凈利潤還將下滑。此前1月,海天瑞聲發布的2022年業績預告顯示,期內營業收入為2.6億元至2.65億元,同比增加25.92%至28.34%,歸母凈利潤為2800萬元至3000萬元,同比下降5.08%至11.41%。
若從海天瑞聲的具體業務來看,其研發、生產的訓練數據覆蓋智能語音、計算機視覺及自然語言處理三大AI核心領域。其中,自然語言處理(Natural Language Processing,NLP)與近日火爆的ChatGPT相關,海天瑞聲的證代也向澎湃新聞記者表達了該觀點。
不過,自然語言處理業務并非海天瑞聲的營收支柱。以2021年的業績為例,期內該公司自然語言處理業務營收2514.9萬元,僅占總營收的約12%。

來源:海天瑞聲2021年財報
當ChatGPT概念火爆出圈,海天瑞聲曾發布公告撇清與ChatGPT的關系,稱公司未與OpenAI開展合作,其ChatGPT的產品和服務未給公司帶來業務收入。海天瑞聲還強調公司專注于為包括AI技術公司在內的AI產業鏈各類機構提供算法模型開發訓練所需的專業數據集,業務與從事人工智能算法及應用開發的企業有比較大的區別。
未看到訂單爆發式增長的情況,押注智能駕駛和海外業務
中國的大型科技企業、人工智能領域企業紛紛表示入局ChatGPT,是否會為海天瑞聲帶來訂單的增長?海天瑞聲方面人士回應澎湃新聞稱,“公司負責做數據,(研發聊天機器人的公司)是我們的下游客戶利用公司的數據訓練產品,我們不是直接去生產產品。”
該人士表示,“技術是一個逐漸升級的過程。現在聊天機器人的概念剛剛起步,技術公司想要應用落地,也需要在內部進行技術上的改革或創新,后期才會看到(訂單)的大量增長。不管是他們那端還是我們這端,初期都不會有立竿見影的效果,或出現訂單爆發式增長的情況。”
另值得關注的是,一些有實力的科技公司在自建團隊做數據業務,這是否會對海天瑞聲造成影響。對此,海天瑞聲方面人士也向澎湃新聞記者表示:“從體量上來說,首先要達到規模效應,客戶才可能考慮自建團隊,自建團隊一般是解決自身部分數據需求,比如敏感數據。出于成本及規模化效益考慮,客戶仍會大量購買數據服務提供商的數據及服務。”
安信證券指出,ChatGPT的訓練過程代表著在未來的人工智能領域,優質的數據源將成為行業的基礎設施。海天瑞聲表示,公司數據處理業務正在快速增長,為保障充足產能,公司已開始在技術研發、資源體系擴充兩個維度同步進行建設。
根據該公司2021年財報,海天瑞聲擁有2個“面向NLP特定領域事件理解、抽取與標注平臺”的在研項目,預計總投資規模為180萬元和160萬元,最新進展為完成、上線了面向NLP特定領域事件理解、抽取與標注平臺,并已支持多類業務場景。
對于公司未來的增長點,從現有信息看,海天瑞聲并未過多著墨ChatGPT,而是將境外業務和智能駕駛作為其核心增長點。
據澎湃新聞記者了解,近幾年,海天瑞聲一直在持續布局海外市場。2022年上半年,該公司境外收入占比達57.14%,境外市場簽單額同比增長近2.5倍。2022年前三季度境外基礎訓練數據業務收入同比增長近140%。境外收入的主要驅動因素來自多語種相關的智能語音以及計算機視覺類業務。
浙商證券也在研報中表示,隨著海外業務的加速布局,海天瑞聲能夠更好地發揮其在語音和自然語言領域的多語種優勢。
智能駕駛業務方面,海天瑞聲表示,從目前公司摸排到的市場需求情況來看,單家智能駕駛客戶(主機廠或頭部智能駕駛算法公司)每年的數據預算從百萬至上億元不等,數據需求整體呈現加速上升的趨勢。
若將視野放大,整個AI訓練數據市場究竟有多大?根據Cognilytica數據統計顯示,2021年全球AI訓練數據市場需求約為42億美元,并預計到2027年這一需求將增長到220億美元,2021年至2027年復合增長率達32%。
聚焦到中國市場,根據IDC發布的《2021年中國人工智能基礎數據服務市場研究報告》,預計中國AI基礎數據服務市場近5年復合年增長率將達到47%,預期2025年將突破120億元。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司