中高級數(shù)據(jù)挖掘工程師
1.3-2.3萬元/月發(fā)布時間: 2025-07-06 08:02
數(shù)據(jù)挖掘
1.3-2.3萬元/月工作職責:
致力于解決科學領域大模型訓練數(shù)據(jù)瓶頸的過程中,參與或主導語料合成、挖掘、評測等方面的算法開發(fā)。直接推動科學領域大模型的精確訓練,為各類科學領域模型的優(yōu)化和應用提供堅實的數(shù)據(jù)支撐。
1.語料數(shù)據(jù)的挖掘與評估,構建智能篩選與評估系統(tǒng),基于語義相關性與內容質量,提升數(shù)據(jù)的精準性與專業(yè)性。
2.智能問答生成、構建覆蓋不同場景的高質量評測數(shù)據(jù)集與度量指標。
3.數(shù)據(jù)治理與風險控制,構建數(shù)據(jù)治理體系,涵蓋元數(shù)據(jù)管理、數(shù)據(jù)標準制定、安全合規(guī)。識別數(shù)據(jù)使用風險,制定應對預案。
4.跨團隊協(xié)作與規(guī)范制定,協(xié)同數(shù)據(jù)開發(fā)、業(yè)務分析團隊,確保數(shù)據(jù)需求與質量目標對齊。
任職要求:
1.計算機科學、人工智能、軟件工程等相關專業(yè),本科及以上學歷;
2.熟悉知識圖譜構建、問答生成與信息檢索等相關技術,有深度學習或相關領域2年以上工作經驗;
3.精通Python及相關數(shù)據(jù)處理、算法實現(xiàn)框架(如TensorFlow、PyTorch等)
4.熟練掌握SQL/NoSQL數(shù)據(jù)庫(MySQL/Clickhouse/Redis/ElasticSearch等)及分布式存儲技術;
5.較強的學習能力和創(chuàng)新能力,良好的團隊合作精神,能在快速變化的技術環(huán)境中不斷提升自己的專業(yè)水平
6.有垂直領域大模型預訓練、SFT及性能評估與改進的優(yōu)先

杭州余杭區(qū)之江實驗室新園區(qū)(西南門)
