很菜但是很有收获

chengsenw 项目开发评论1阅读模式

很菜但是很有收获

很菜但是很有收获

很菜但是很有收获

很菜但是很有收获

很菜但是很有收获

很菜但是很有收获

很菜但是很有收获

用时一整天,跑通了第一个项目(RAG)
(与传统的向量数据库RAG不同,采用知识图谱(Neo4j作为检索组件))

项目链接:https://github.com/honeyandme/RAGQnASystem?tab=readme-ov-file
(可以提前注意踩坑点)

是一门课程的期末项目,找github上项目来复现,目前仅仅是跑通,没有搞懂原理,没有自己的创新。

收获还是挺大的,各方面。之前用github的代码基本上导入几个包就能运行了,像是玩具。现在这个感觉有些麻烦(比较精致的玩具hhh)

作者的项目很好,star也很多,但是readme文档不太详细,甚至有错误,踩坑不少...
(如果readme详细准确一些的话,2-3h应该能跑通)

收获与踩坑:

下载:有时候梯子网速不佳时,感觉微信浏览器能绕过墙,直接高速下载。(现在是直接把链接发到聊天再点开,不知道有没有直接的微信浏览器窗口)
p2:文件下载时,拓宽了新思路。(p2作者的启发)
java还比较好下载安装,neo4j社区特定版非常难找,本人是照着现在官网上提供的社区最新版本(比较恶心,其他版本非常不好找,找了一下午没找到)的下载路径更换版本号及平台名称获取到的,然后发现该网址一次就蒙对了,很是开心。
也就是最后下载前浏览器上面有地址,找到版本号对应的地方改一下,就能下到想要的版本(neo4j官方什么都有,但是不展示出来,增加下载的困难,何必呢)
(第二天发现,评论区有佬总结出来各个版本...不过收获这个下载技巧还是挺不错的!)

对github,py环境,配置系统环境变量等操作都更熟练了一些

在下载requirements时,conda那里报错,感觉也是作者项目(/版本)的问题
torch==2.2.1+cu118 是针对CUDA 11.8的特定版本,在Windows上不能直接通过pip安装,需要使用PyTorch官方的安装方式

导入知识图谱很慢,加强熟练了跑代码时刷手机的操作

最大的坑:(p4)
作者这样说让人以为,不训练模型的话,点“下载”,只下载best_roberta_rnn_model_ent_aug.pt就可以了。但是实际上chinese-roberta-wwm-ext里的要下,而且要放在model文件夹下的chinese-roberta-wwm-ext文件夹里
实际上应该是若不想训练,该下的都下,只是可以不运行python ner_model.py #可以不运行

到下载模型的时候,提前想了下,1650显卡(4g),能下载什么呢?简单计算了下感觉4B模型应该没问题(还好,最后也确实没问题)
最后下载ollama,qwen:4b也很顺利

搞懂整个逻辑后,把bug都de完,就跑通了。感觉更多的还是文档说明不清晰的问题

希望能搞懂全部内容,做一些自己的创新!

 
chengsenw
  • 本文由 chengsenw 发表于 2025年12月17日 21:03:45
  • 转载请务必保留本文链接:https://www.gewo168.com/8925.html
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: