找回密码
 加入我们
搜索
      
查看: 628|回复: 6

[软件] 投喂论文给AI,训练专业领域助手可行吗,需要多大算力

[复制链接]
发表于 2025-7-4 09:48 | 显示全部楼层 |阅读模式
想启动一个,个人小项目,试水着玩,项目里需要大量物理结论的运用

手里有一些高质量论文,训练一个专业领域的AI助手可行性高吗?

我对AI的技术边界不太清楚,完全小白想问下 如何实现比较好?

1.自建AI,然后投喂数据训练?用哪个模型好,只做知识助手的话,算力需要多大,没显卡纯靠cpu行吗,公司有一个Xeon Gold 6248老古董
训练要多久

2.有这方面现成的AI agent吗

小白,问的不专业,有啥坑吗最后,搞起能用吗
发表于 2025-7-4 10:03 | 显示全部楼层
自己训练需要一定的投入,最佳的方案是充gemini和openai的deepresearch。
发表于 2025-7-4 10:07 | 显示全部楼层
抛开资源需求不谈

现在 LLM 都是指令模型, 你直接把 paper 扔进去不行, 需要构造问答形式的数据
所以目前主流(其实本地瞎搞无论如何都不算主流了)都是用 RAG https://github.com/chatchat-space/Langchain-Chatchat, 搞搞文档还行, paper 行不行我还没见过.
 楼主| 发表于 2025-7-4 10:20 | 显示全部楼层
xy. 发表于 2025-7-4 10:07
抛开资源需求不谈

现在 LLM 都是指令模型, 你直接把 paper 扔进去不行, 需要构造问答形式的数据

好 我看看,谢谢
 楼主| 发表于 2025-7-4 10:20 | 显示全部楼层
我輩樹である 发表于 2025-7-4 10:03
自己训练需要一定的投入,最佳的方案是充gemini和openai的deepresearch。

明白了 ,谢谢 我试试
发表于 2025-7-4 10:22 | 显示全部楼层
ima  自己搞搞
发表于 2025-7-4 11:03 | 显示全部楼层
直接的论文又不能当训练集,训练集是QA对,这个要么人工生成要么让AI帮忙生成人工校正和筛选还有就是目前什么dify、ima、扣子这些的知识库也都基本没啥大用
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-7-5 18:01 , Processed in 0.209186 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表