
AI訓練數據包(高等數學系列)|合規大模型訓練語料|LLM訓練數據集|比自己獲取節省80%|接受企業定制|立即采購
HK$19,999.00
HK$99,999.00
數據包覆蓋了世界知名大學的大學、碩士、博士、研究員等水平的研究、學術、問答數據等。
數據包內大學目錄含:耶魯大學、哈佛大學、牛津大學、紐約大學、芝加哥大學、劍橋大學等教學解題數據與教學材料等。
數據包包含:原始數據、經處理的數據、數據包使用手冊等,可直接進行大模型訓練,合計約2000G左右,大概約1億條高級數學數據。
本數據由於數量較大,分為4個數據包版本,每個數據包4.9萬港幣,每個約3000萬左右高級數學數據。4個一起購買享受6.9折優惠。
更新日誌:數據包的定期更新可能會因每次更新而改變,例如,優化數據錯誤、重復率、格式變化等,具體以實際為準。
發布日期:2025年3月22日(本數據包每3個月會對數據進行更新與增加數據量,已購買的用戶可在下載鏈接中免費獲取最新的數據)
更新日誌:5月7日起,4個數據包皆更新為最新數據,非舊數據。
付款與貨幣結算:
本平臺接受多種支付方式,包括:VISA、支付寶等。(其他支付方式請聯系客服獲取。)
本商城以港幣(HKD)為結算貨幣,購買時系統會自動按當前匯率轉換成當地貨幣進行支付。
如購買金額較大(超過10萬港幣),可聯系客服獲取大額付款方式(例如企業支付寶、企業轉賬、USDT等)。
🇭🇰香港用戶需要使用AlipayHK, WeChatPayHK, FPS(轉數快),可聯系客服獲取香港地區付款鏈接。
🇸🇬新加坡用戶需要使用Paynow支付的,也可聯系客服獲取新加坡地區PayNow付款鏈接。
發貨與服務:
所有可下單的產品均有現貨,付款成功後,系統將自動發貨至您的郵箱。
如需了解更多關於我們的服務與售後政策等信息,請查看我們的服務條款和隱私政策。
- 2025年3月22日,最新發布高階數學類資料包(1986G) ,本資料包與數學類資料包(516G)重複率不超過1%。
- 數據來自世界知名大學相關資訊管道獲取的大學以上水平的問題、答案、材料等,並透過允許各大模型技術使用文本推理和Python 解釋器執行的代碼塊混合來綜合生成解決方案。
- 資料包內大學目錄包含:耶魯大學、哈佛大學、牛津大學、紐約大學、芝加哥大學、劍橋大學等教學解題資料與教材等,資料集分為我們在消融實驗中所使用的訓練與驗證子集。全量皆為大學程度以上。
- LLM大模型訓練資料包(高級數學類)包含以下欄位:
question:來自名校等管道的高階數學問題 。
generated_solution:使用文字推理和程式碼區塊混合生成的解決方案。
expected_answer:原始資料集中提供的真實答案。
predict_answer:對應解中Mixtral 模型預測的答案(從中提取\boxed{})。
error_message:<not_executed>如果未使用代碼。否則為空或包含來自對應程式碼區塊的Python 異常。字串timeout表示程式碼區塊執行時間超過10 秒。在當前資料集版本中,我們總是在出現任何錯誤或逾時後停止產生。
is_correct:我們的評分腳本是否認為最終答案正確。
資料集:neuronicx_math_high或neuronicxLLM-math_high。
generation_type:without_reference_solution或masked_reference_solution。
其他補充:由於資料龐大,格式眾多,我們除了將資料整理成以上適合LLM訓練格式外,對於更複雜的題目進行了額外的資料解釋和補充,部分需要補充的資料則會增加相關的資料特性(例如增加更多欄位、格式)。
原始資料集:部分數學由於符號過為複雜,一般會以原始資料直接訓練,因此不做Jason格式的轉換處理。
( LLM訓練格式範例Jason格式資料範例)
- 資料包包含:原始資料、處理過的資料、資料包使用手冊等,可直接進行大模型訓練,合計約2000G左右,大概約1億個進階數學數據,大部分為文件、Text、Jason、Latex、圖片、影片等格式。
- 本數據由於數量較大,分為4個數據包版本,每個數據包4.9萬港幣,每個約3000萬左右高級數學數據。
更新日誌:資料包的定期更新可能會因每次更新而改變,例如,優化資料錯誤、重複率、格式變更等,具體以實際為準。
發佈日期:2025年3月22日(本資料包每3個月會對資料進行更新與增加資料量,已購買的用戶可在下載連結中免費取得最新的資料)
在官網一次下單多個資料包時,你可以使用以下優惠碼進行減免。 (本系列分批下單不支援以下優惠)
- 10%優惠碼:LLM10(購買2個Chegg資料包時使用,可直接減免10%金額)
- 20%優惠碼:LLM20(購買4個Chegg資料包時使用,可直接減免20%金額)
- 30%優惠碼:LLM30(購買6個Chegg資料包時使用,可直接減免30%金額)
- 40%優惠碼:LLM40(購買8個Chegg資料包時使用,可直接減免40%金額)
- 50%優惠碼:LLM50(購買10個Chegg資料包時使用,可直接減免50%金額)
注意:官網自助下單如金額較大,可能無法支付,需聯絡客服取得大額支付方式。
( LLM大模型原始資料範例LaTex格式範例)
(將LLM資料包訓練後的使用效果範例)