投喂论文给AI，训练专业领域助手可行吗，需要多大算力

farwish 发表于 2025-7-4 09:48

想启动一个，个人小项目，试水着玩，项目里需要大量物理结论的运用

手里有一些高质量论文，训练一个专业领域的AI助手可行性高吗？

我对AI的技术边界不太清楚，完全小白想问下如何实现比较好？

1.自建AI，然后投喂数据训练？用哪个模型好，只做知识助手的话，算力需要多大，没显卡纯靠cpu行吗，公司有一个Xeon Gold 6248老古董
训练要多久

2.有这方面现成的AI agent吗

小白，问的不专业，有啥坑吗最后，搞起能用吗

我輩樹である 发表于 2025-7-4 10:03

自己训练需要一定的投入，最佳的方案是充gemini和openai的deepresearch。

xy. 发表于 2025-7-4 10:07

抛开资源需求不谈

现在 LLM 都是指令模型, 你直接把 paper 扔进去不行, 需要构造问答形式的数据
所以目前主流(其实本地瞎搞无论如何都不算主流了)都是用 RAG https://github.com/chatchat-space/Langchain-Chatchat, 搞搞文档还行, paper 行不行我还没见过.

farwish 发表于 2025-7-4 10:20

xy. 发表于 2025-7-4 10:07
抛开资源需求不谈

现在 LLM 都是指令模型, 你直接把 paper 扔进去不行, 需要构造问答形式的数据

好我看看，谢谢

farwish 发表于 2025-7-4 10:20

我輩樹である发表于 2025-7-4 10:03
自己训练需要一定的投入，最佳的方案是充gemini和openai的deepresearch。

明白了，谢谢我试试

qp6g3o 发表于 2025-7-4 10:22

ima自己搞搞

gladiator 发表于 2025-7-4 11:03

直接的论文又不能当训练集，训练集是QA对，这个要么人工生成要么让AI帮忙生成人工校正和筛选[偷笑]还有就是目前什么dify、ima、扣子这些的知识库也都基本没啥大用

页: [1]

Chiphell - 分享与交流用户体验's Archiver

投喂论文给AI，训练专业领域助手可行吗，需要多大算力