行情
新聞
分析
使用者
快訊
財經日曆
學習
數據
- 名稱
- 最新值
- 前值
【馬斯克:Ai訓練資料已耗盡,合成資料將成未來方向】據Techcrunch報道,埃隆馬斯克在與Stagwell董事長Mark Penn的直播對話中表示,目前Ai模型的訓練已基本耗盡真實世界的數據,「我們已經用盡了人類知識的累積總和,這在去年就發生了。」馬斯克與前Openai首席科學家Ilya Sutskever的觀點一致,後者在Neurips機器學習大會上提出Ai產業已達到“資料高峰”,未來可能需要改變模型開發方式。
馬斯克認為,合成數據將是補充真實數據的途徑,Ai將透過產生和自我評估數據實現自我學習。這一趨勢已被包括微軟、Meta、Openai和Anthropic等科技巨頭採用,如微軟Phi-4模型和谷歌Gemma模型都結合了真實數據和合成數據進行訓練。 Gartner預測,2024年Ai和分析計畫中約60%的數據將為合成產生。
合成資料的優點包括成本節約,例如Ai新創公司Writer僅花費約70萬美元開發其幾乎完全基於合成資料的Palmyra X 004模型,相較之下,類似規模的Openai模型開發成本約為460萬美元。然而,合成資料也存在風險,包括模型創造力下降、輸出偏差加劇,以及潛在的模型崩潰,尤其當訓練資料本身有偏差時,生成結果也可能受到影響。
AI快訊快速達
實时快速傳達更多精選快訊內容
獨家影片免費看
FastBull專案團隊傾情打造獨家影片,僅會員可以查看影片
追蹤更多行情品種
可增加更多自選品種,實時追蹤更多行情數據
宏觀數據、經濟指標更全面
更全面的指標歷史數據,助力分析宏觀市場
專屬會員數據
更全面的貨幣、貴金屬、原油數據