farwish 发表于 2025-7-4 09:48

投喂论文给AI,训练专业领域助手可行吗,需要多大算力

想启动一个,个人小项目,试水着玩,项目里需要大量物理结论的运用

手里有一些高质量论文,训练一个专业领域的AI助手可行性高吗?

我对AI的技术边界不太清楚,完全小白想问下 如何实现比较好?

1.自建AI,然后投喂数据训练?用哪个模型好,只做知识助手的话,算力需要多大,没显卡纯靠cpu行吗,公司有一个Xeon Gold 6248老古董
训练要多久

2.有这方面现成的AI agent吗

小白,问的不专业,有啥坑吗最后,搞起能用吗

我輩樹である 发表于 2025-7-4 10:03

自己训练需要一定的投入,最佳的方案是充gemini和openai的deepresearch。

xy. 发表于 2025-7-4 10:07

抛开资源需求不谈

现在 LLM 都是指令模型, 你直接把 paper 扔进去不行, 需要构造问答形式的数据
所以目前主流(其实本地瞎搞无论如何都不算主流了)都是用 RAG https://github.com/chatchat-space/Langchain-Chatchat, 搞搞文档还行, paper 行不行我还没见过.

farwish 发表于 2025-7-4 10:20

xy. 发表于 2025-7-4 10:07
抛开资源需求不谈

现在 LLM 都是指令模型, 你直接把 paper 扔进去不行, 需要构造问答形式的数据


好 我看看,谢谢

farwish 发表于 2025-7-4 10:20

我輩樹である 发表于 2025-7-4 10:03
自己训练需要一定的投入,最佳的方案是充gemini和openai的deepresearch。

明白了 ,谢谢 我试试

qp6g3o 发表于 2025-7-4 10:22

ima自己搞搞

gladiator 发表于 2025-7-4 11:03

直接的论文又不能当训练集,训练集是QA对,这个要么人工生成要么让AI帮忙生成人工校正和筛选[偷笑]还有就是目前什么dify、ima、扣子这些的知识库也都基本没啥大用
页: [1]
查看完整版本: 投喂论文给AI,训练专业领域助手可行吗,需要多大算力