返回

K12教育數據包|合規大模型訓練語料|LLM訓練數據集|含有題目、答案、解析、Latex渲染|中文版、英文版可選|立即購買
HK$29,999.00
HK$49,999.00
K12數據包簡介:
包含約6000萬條高質量教育數據。
數據皆為純文本Jason格式(查看以下示例)。
其中,中文版為2500萬條,英文版為2900萬條。
中文版與英文版的數據無重復,都是不同渠道采集的數據。
中文版是以中國、香港等中文地區學校采集而來,英文版是以美國、英國、加拿大等英文地區學校采集而來。
每條數據含都有:ID、題目、(部分有提幹)、答案、解析、學科、年級分類、難度。(帶公式部分已經進行了Latex和$成對渲染)
數據覆蓋K12階段所有核心學科,並提供中文和英文兩個版本選擇,既可獨立使用,也可一起購買雙語聯合用於多語種模型訓練。2個數據包一起購買享受8折優惠。
更新日誌:5月7日起,3個數據包皆更新為最新數據。
付款與貨幣結算:
本平臺接受多種支付方式,包括:VISA、支付寶等。(其他支付方式請聯系客服獲取。)
本商城以港幣(HKD)為結算貨幣,購買時系統會自動按當前匯率轉換成當地貨幣進行支付。
如購買金額較大(超過10萬港幣),可聯系客服獲取大額付款方式(例如企業支付寶、企業轉賬、USDT等)。
🇭🇰香港用戶需要使用AlipayHK, WeChatPayHK, FPS(轉數快),可聯系客服獲取香港地區付款鏈接。
🇸🇬新加坡用戶需要使用Paynow支付的,也可聯系客服獲取新加坡地區PayNow付款鏈接。
發貨與服務:
所有可下單的產品均有現貨,付款成功後,系統將自動發貨至您的郵箱。
如需了解更多關於我們的服務與售後政策等信息,請查看我們的服務條款和隱私政策。
包含約6000萬條高質量教育數據。
數據皆為純文本Jason格式(查看以下示例)。
其中,中文版為2500萬條,英文版為2900萬條。
中文版與英文版的數據無重復,都是不同渠道采集的數據。
中文版是以中國、香港等中文地區學校采集而來,英文版是以美國、英國、加拿大等英文地區學校采集而來。
每條數據含都有:ID、題目、(部分有提幹)、答案、解析、學科、年級分類、難度。(帶公式部分已經進行了Latex和$成對渲染)
數據覆蓋K12階段所有核心學科,並提供中文和英文兩個版本選擇,既可獨立使用,也可一起購買雙語聯合用於多語種模型訓練。2個數據包一起購買享受8折優惠。
更新日誌:5月7日起,3個數據包皆更新為最新數據。
付款與貨幣結算:
本平臺接受多種支付方式,包括:VISA、支付寶等。(其他支付方式請聯系客服獲取。)
本商城以港幣(HKD)為結算貨幣,購買時系統會自動按當前匯率轉換成當地貨幣進行支付。
如購買金額較大(超過10萬港幣),可聯系客服獲取大額付款方式(例如企業支付寶、企業轉賬、USDT等)。
🇭🇰香港用戶需要使用AlipayHK, WeChatPayHK, FPS(轉數快),可聯系客服獲取香港地區付款鏈接。
🇸🇬新加坡用戶需要使用Paynow支付的,也可聯系客服獲取新加坡地區PayNow付款鏈接。
發貨與服務:
所有可下單的產品均有現貨,付款成功後,系統將自動發貨至您的郵箱。
如需了解更多關於我們的服務與售後政策等信息,請查看我們的服務條款和隱私政策。
選擇
數量
加入購物車
更多詳情
K12資料包- 合規大模型訓練語料| LLM訓練資料集|簡介:
- 包含約6000萬條高品質K12數據。
- 資料皆為純文字Json格式(請參閱以下範例)。
- 其中,中文版為2500萬條,英文版為2900萬條。
- 中文版與英文版的數據無重複,都是不同管道採集的數據。
- 中文版是以中國、香港等中文地區學校採集而來,英文版則是以美國、英國、加拿大等英文地區學校採集而來。
- 每條K12資料含都有: ID、題目、(部分有提幹)、答案、解析、學科、年級分類、難度。 (帶公式部分已經進行了Latex和$成對渲染)
- 資料涵蓋K12階段所有核心學科,並提供中文和英文兩個版本選擇,既可獨立使用,也可一起購買雙語聯合用於多語種模型訓練。 2個數據包一起購買享受20折優惠。
數據詳情:
- 資料量: 共約6,000萬條教育領域數據,涵蓋海量題目與解答,滿足深度學習模式對大規模語料的訓練需求。
- 語言版本: 提供中文和英文兩種版本的資料集,可分別獨立使用,也可聯合進行多語種訓練,實現跨語言的知識豐富度。
- 學科涵蓋: 本資料包涵蓋K12階段全部核心學科,包括語文、數學、英語、科學、物理、化學、生物、歷史、地理、政治等,確保知識面廣泛全面。
- 分類結構: 採用清楚的分層分類體系,依據學段、學科、題型、難度等維度組織數據,結構化程度高,便於按需篩選與定向訓練。
- 資料格式: 資料以JSON、CSV等標準格式提供,每筆記錄包含完整欄位資訊(如ID、題目、(部分有提幹)、答案、解析、學科、年級分類、難度等),方便快速匯入模型訓練管道。
- 資料來源與合規: 資料來源正規且經過嚴格篩選,確保內容真實有效且無版權爭議,可安全用於商業和研究用途。
- 可擴展性: 支援自訂特定子集或增強特定學科領域資料。根據專案需求,可靈活擷取某學科或難度範圍的數據,用於定向訓練與擴展。
中文版範例
英文版範例