[论文笔记/基准] RELIABLE AND DIVERSE EVALUATION OF LLM MEDICAL KNOWLEDGE MASTERY
RELIABLE AND DIVERSE EVALUATION OF LLM MEDICAL KNOWLEDGE MASTERY
该文章于2025年发表在ICLR(CCF A),早在2024年9月发布在arxiv。
文章地址:Reliable and Diverse Evaluation of LLM Medical Knowledge Mastery
arXiv:[2409.14302] Reliable and diverse evaluation of LLM medical knowledge mastery
代码仓库:Gi ...
"Source Code Summarization in the Era of Large Language Models" 论文笔记
介绍
(1) 发表:ICSE'25
(2) 背景
之前的研究表明,与传统的代码摘要模型相比,LLM 生成的摘要在表达方式上与参考摘要有很大不同,并且倾向于描述更多的细节。因此,传统的评估方法是否适合评估 LLM 生成摘要的质量仍然未知
(3) 贡献
受到 NLP 工作的启发,本文对使用 LLM 本身作为评估方法的可能性做了全面的探索研究(不 ...
11. LangChain4j + Tools(Function Calling)的使用详细说明
11. LangChain4j + Tools(Function Calling)的使用详细说明
@目录11. LangChain4j + Tools(Function Calling)的使用详细说明实战LangChain4j + Tools(Function Calling)方式一: 低级别,使用 ChatModel 和 ToolSpecification API 方式二:高级别,使用 AI Services 和带有 @Tool 注解的 Java 方法最后:
官网:https://do ...
[论文笔记/综述] A survey of large language models for healthcare: from data, technology, and applications to accountability and ethics
A survey of large language models for healthcare: from data, technology, and applications to accountability and ethics
该文章于2025年发表在Information Fusion(中科院一区),早在2023年10月发布在arxiv。
文章地址:https://dl.acm.org/doi/10.1016/j.inffus.2025.102963
arXiv:https://arxiv.org/abs/2310.05 ...
掌握Spring IoC容器和Bean作用,轻松实现依赖注入!
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
Spring 框架 ...
9. LangChain4j + 整合 Spring Boot
9. LangChain4j + 整合 Spring Boot
@目录9. LangChain4j + 整合 Spring BootLangChain4j + 整合 Spring Boot 实操最后:
LangChain4j 整合 SpringBoot 官方文档:https://docs.langchain4j.dev/tutorials/spring-boot-integration/
浅谈—下:LangChain4j twolevels of abstraction
低阶 APi 和 高阶 API
Spring Boot ...
如何通过LangChain实现记忆功能的总结
真正贴近人类的智能体,关键在于拥有 “记忆能力”。就像人与人相处时,我们会记住对方的喜好、过往的交流细节,并以此调整后续的沟通方式;具备记忆的智能体,同样能在与用户的互动中,主动留存对话信息、记录关键需求,甚至沉淀用户偏好,进而在未来的交互中给出更精准、更贴心的响应。
本篇实践指南,就将聚焦如何基于 L ...
聚焦结构化注意力,探索提升多模态大模型文档问答性能
作者:vivo 互联网算法团队
本文聚焦多模态大语言模型(MLLMs)在文档问答(DocQA)任务中的性能提升,提出无需改动模型架构或额外训练的结构化输入方法,通过保留文档层次结构与空间关系(如标题、表格、图像位置)优化理解能力。研究发现,传统无结构OCR输入导致注意力分散,性能下降,而 LaTeX 范式结构化输入显著提升 ...
7. LangChain4j + 记忆缓存详细说明
7. LangChain4j + 记忆缓存详细说明
@目录7. LangChain4j + 记忆缓存详细说明LangChain4j + 记忆缓存实战操作最后:
https://docs.langchain4j.dev/tutorials/chat-memory/
记忆缓存是聊天系统中的一个重要组件,用于存储和管理对话的上下文信息。它的主要作用是让AI助手能够"记住"之前的对话内容,从而提供连贯和个性 ...
ZeroGPU Spaces 加速实践:PyTorch 提前编译全解析
ZeroGPU 让任何人都能在 Hugging Face Spaces 中使用强大的 Nvidia H200 硬件,而不需要因为空闲流量而长期占用 GPU。 它高效、灵活,非常适合演示,不过需要注意的是,ZeroGPU 并不能在所有场景下完全发挥 GPU 与 CUDA 栈的全部潜能,比如生成图像或视频可能需要相当多的时间。在这种情况下,充分利用 H200 硬件,使其发 ...
"AgenTracer: Who Is Inducing Failure in the LLM Agentic Systems?" 论文笔记
介绍
(1) 发表:Arxiv 09.03
(2) 背景
查明对长执行跟踪链路中错误负责的特定代理或步骤被定义为代理系统故障归因的任务。然而,当前最新的推理 LLMS 仍不为此挑战而明显不足,精度通常低于10%
尽管现有工作已经作出了初步尝试,但他们仍然存在实质性的研究差距:① 培训资源(涉及大规模注释的多代理轨迹的自动构建) ② ...
掌控AI编程全链路:Cline让你随意选模型、透明成本、零信任安全
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 坚定开源 A ...
告别文档搜索与同事打扰:Augment AI 聊天 + 200K 上下文全方位助力开发
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 前言
超强A ...
RooCode实用指南:从coser到人工中继的全能AI代码助手
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 前言
原名 ...
基于LangChain的Ai应用开发平台
在 AI 技术日新月异的今天,Deepseek 引领的 AI 技术革命正席卷而来,彻底改变着各行各业的工作形态。尤其是软件研发领域,AI 已成为提升开发效率的关键利器,不懂利用 AI 的研发人员,似乎正逐渐被时代的浪潮所抛下。
今天,我就来分享近两年在 AI 学习与探索之路上的点点滴滴,希望能与感兴趣的小伙伴们一同进步。代码仓 ...
Spring Boot如何启动嵌入式Tomcat?
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 前言
Sprin ...
你的ChatBI(问数)准确率不到50%?带你深度拆解90%准确率的高德ChatBI案例
"我们的ChatBI上线半个月,准确率不到50%,老板问我们是不是在做假demo..."
如果你在做ChatBI,或正在评估要不要上ChatBI,相信你遇到过类似问题。
很多团队以为"ChatBI就是用大模型做自然语言到SQL的转换"。
有时还会被领导质疑:"找个开源项目3天就能搞定,你们怎么用了这么久?"
几度陷入自我怀疑…
要知道,单纯依赖开 ...
攻克大模型训练网络瓶颈,天翼云论文获ACM ICS顶会收录!
近日,由天翼云公有云事业部联合基础架构事业部所撰写的论文《CTCCL: Cost-Efficient Joint Device-Network Load Balancing for LLM Training in RoCE-based Intelligent Computing Network》被第39届ACM International Conference on Supercomputing 2025 (简称ICS)收录。这一成果不仅标志着天翼云在智算网络领域的技术突 ...
6. LangChain4j + 多模态视觉理解详细说明
LangChain4j + 多模态视觉理解详细说明
@目录LangChain4j + 多模态视觉理解详细说明LangChain4j进行图像理解LangChain4j 多模态实战结合LangChain4j进行图像理解,其支持视觉-语言的多模态任务结合阿里巴巴通义万相进行图像生成(文本生成图像)最后:
LangChain4j进行图像理解
多模态之视觉理解:
https://docs.langchain4j ...
Windows本地安装LLaMA-Factory
以下是LLaMA-Factory官方推荐的依赖组件及其版本,如果在linux上安装建议使用表格中的推荐版本,但是在windows上安装时,由于各组件提供的windows版本没有linux版本完备,为了兼容性考虑可节省时间(使用发布的wheel包而不是本地编译),这里并没有完全采用官方推荐的版本。
以下为window本地安装LLaMA-Factory的详细步骤
...