中新網包頭2月23日電 題:人大代表閆宏偉:當稀土遇到DeepSeek
記者 李愛平
輕啟筆記本電腦,倒上一杯熱水,在內蒙古自治區包頭稀土研究院,閆宏偉的一天這樣開始了。
蛇年春節過后,他在日常工作中多了一個“朋友”——DeepSeek(深度求索)。過去20多天,他將其運用到“稀土通用語料庫及其系統的設計和研發”(簡稱稀土語料庫)項目中,頗有成就感。
圖為閆宏偉在工作中。 中新網記者 李愛平 攝“在研究中,若有不懂之處,請教DeepSeek,很快就能獲得啟發?!遍Z宏偉近日在接受中新網記者專訪時表示,DeepSeek助力了研發項目,堪稱自己的“左膀右臂”。
作為全國人大代表,閆宏偉是在2024年全國兩會結束后開始擁抱人工智能的。彼時,他深感在稀土領域,融入人工智能,已是未來必然趨勢。
“但那時DeepSeek還未橫空出世,我只能通過購買各類專著,一點點學起。”在閆宏偉的辦公室內,他學習過的《線性代數》《數據有道》等書籍上都留下了他標記的勾勾畫畫。
學習一段時間后,閆宏偉開始主動介入人工智能。他最先運用到的是ChatGPT?!斑\用ChatGPT的第一感覺是,這款人工智能模型不僅能答疑解惑,還節省研發時間,但尚有美中不足之處?!?/p>圖為閆宏偉在四川參加學術會議。(資料圖,受訪者供圖)
閆宏偉認為,在人工智能的助力下構建稀土語料庫項目,能填補包頭稀土研究院在該項目上的空白?!霸谙⊥列袠I內使用各類大語言模型、人工智能模型和機器學習模型進行訓練,時不我待?!?/p>
“現在DeepSeek-R1的中文理解能力大幅度提高,推理能力更是達到了全球領先水平。”閆宏偉認為,必須對DeepSeek給予重新理解,找出更好的解決方案。
為此,他開始嘗試引入DeepSeek-R1作為助手,解決沒有資源、人手的困難。他力爭在6月份前完成稀土語料庫的研發。
“這個項目研發成功,也意味著一個標準稀土語料庫宣告建設完成?!遍Z宏偉認為,這是自己這個人工智能領域“小白”努力至今做的最正確的事情。
稀土遇到DeepSeek,在閆宏偉的手中到底能碰撞出什么樣的火花?他認為,開發稀土語料庫,首要是為了訓練和微調自己的機器學習模型與大語言模型,這個應用場景直觀但是需要專注細節,通過不斷增加語料庫,可以為行業參與者提供持續的人工智能基礎支持。
當下,閆宏偉在研發稀土語料庫的過程中,還開發了稀土語料庫管理系統。
“實際上這是一個語料庫生產系統,利用它,可以不斷地將行業和組織的私有文獻加工成易于訓練和微調的數據集,并且將原始資料和語料庫視為某種廣義標記數據集。”閆宏偉認為,此舉對探索跨文本(含音視頻等)資料語料化的技術路線和實現具有重大意義,也對他所從事的稀土行業有著重大意義。(完)