收藏本版 |订阅

AI大模型 今日: 0|主题: 313|排名: 11 

  • Stanford-CS336-Lecture-01 Tokenization
    1.资源 课件资料:https://github.com/stanford-cs336/spring2025-lectures clone下来后,将var目录移动到trace-viewer中的public目录内,将images目录也移动到public目录内,然后cd trace-viewer,以此命令npm install和npm run dev,到浏览器打开如下链接来看第一章的课件: http://localhost:5173?trace=/var/traces/lec ...
    026 大芳芳 发表于 2026-2-19 AI大模型
  • 从0到1,无代码微调并部署本地大语言模型LLM
    前言 LLM模型微调 能让大模型掌握特定行业的深度知识,能够实现AI虚拟主播,AI医生,AI程序员,AI网络安全工程师等特定领域的延展。更重要的是,当有本地部署的硬件条件限制时,能够让微调后小的大语言模型等效百亿级的大语言模型 测试环境:windows11,RTX4070显卡 下面将手把手带你跑通无代码模型微调的全过程 环境安装 ...
    098 落花成迷 发表于 2026-2-14 AI大模型
  • 基于Ai Coding,20天完成一个基于大模型的医学分析系统:Ai体征分析助手
    目录 1.Ai Copilot实践与应用... 1 2.Ai Coding带来的好处与挑战... 1 2.1 带来的好处... 2 2.2 面临的挑战... 2 3.Ai体征分析助手项目介绍... 2 3.1业务介绍... 2 3.2技术体系... 7 4.总结... 8  基于Ai Coding,20天完成一个基于大模型的医学分析系统:Ai体征分析助手    我是一名长期使用C#开发后台服务与 ...
    096 麟骏 发表于 2026-2-5 AI大模型
  • 国产大模型适配优选,MonkeyCode 赋能企业研发
    长亭MonkeyCode AI开发平台上线:免费算力赋能,AI助力全场景工程级研发落地 当前AI编程工具层出不穷,但多数仅能应对“代码撰写、Demo运行”的基础场景,难以匹配真实工程研发的复杂诉求。长亭科技全新推出的AI开发平台MonkeyCode,成功突破这一行业瓶颈——平台以企业级研发标准构建,让AI深度参与从需求梳理到Review验收 ...
    018 瑞纳 发表于 2026-2-3 AI大模型
  • [大模型实战 02] 图形化的大模型交互: Open WebUI部署指南
    核心摘要 (TL;DR) 目标:为本地的 Ollama 模型穿上漂亮的图形化界面 (GUI)。 工具:Docker + Open WebUI (社区最活跃的开源 WebUI)。 核心功能:媲美 ChatGPT 的对话界面、本地知识库 (RAG)、自定义角色 (Agent)。 相信各位友人在上一篇文章中,已经学会了如何用ollama在终端中运行Qwen模型。命令行工具有时候会感觉有 ...
    035 荷花旋旋 发表于 2026-2-2 AI大模型
  • 从0到1,快速训练并使用YOLO模型
    简介 YOLO是目前计算机视觉领域最前沿、应用最广泛的目标检测算法框架,他能快速识别区分目标,广泛应用于游戏,无人驾驶,工业等领域。 以识别躲避掉落滑块的游戏的物体图片作为例子。 一,环境配置 pip install ultralytics 二,准备数据集 这个格式目录如下: my_dataset/ ├── data.yaml # 配置文件(定义路径和类别 ...
    067 徐霖凯奶奶 发表于 2026-1-31 AI大模型
  • stable_baseline3 快速入门(二): 训练自定义游戏,构建Gymnasium训练环境
    简介 Gymnasium 为强化学习提供了一个标准化的API,它定义了 Agent 应该如何观察世界、如何做出动作以及如何获得奖励,不管是游戏,还是工业设备,只需要满足Gymnasium标准都能使用同一套代码进行训练。 认识Gymnasium 使用stable_baseline3只需要定义好Gymnasium环境,关注训练的奖励机制,将重点放在业务的开发上而不是复 ...
    035 一个倾听者 发表于 2026-1-30 AI大模型
  • stable_baseline3 快速入门(一): 训练第一个强化学习模型
    简介 stable_baseline3 是一个基于 PyTorch 的强化学习算法开源库,里面集成了多种强化学习算法,使用这个开源库能够让我们不需要过度关注强化学习算法细节,专注于AI业务的开发。 环境配置 pip install stable-baselines3 pip install gymnasium 这里stable-baselines3会默认安装pytroch框架,但是是不带cuda版本的,这就 ...
    067 蒋学刚 发表于 2026-1-29 AI大模型
  • AI模型Claude的Haiku、Sonnet、Opus 怎么选?
    claude模型有以下版本:haiku(诗),Sonnet(好诗),Opus(杰作) claude不同模型之间对比 模型版本 速度 成本 智力水平 最佳应用场景 Haiku 极快 ⚡️ 最低 💰 入门级 客服、翻译、大量简单数据清洗 Sonnet 快 🚀 中等 💰💰 高级 (主流) 编程、日常办公、视觉分析 (性价比之王) Opus 较慢 🐢 最高 💰💰💰 顶级 🧠 ...
    02 胖胖的小香猪 发表于 2026-1-29 AI大模型
  • 智能客服不是问答机器人,微调更不是“多训点数据”
    大多数“智能客服失败”,不是模型不行,而是期望错了 如果你做过或接触过智能客服项目,大概率会经历一个相似的心理过程: 一开始觉得: “现在大模型这么强,客服这种问答场景,不是正好对口吗?” 然后你会很快发现现实是: 问题很杂 规则很多 灰度极多 一句话答错,后果可能很严重 最后,团队往往会把希望寄托在一件 ...
    088 有芝有味 发表于 2026-1-28 AI大模型
  • PPO 微调的本质:它不是在教模型“更聪明”
    PPO 难,不是因为算法复杂,而是因为它在干一件反直觉的事 如果你第一次接触 PPO 微调,大概率会有一种强烈的挫败感。 你可能已经: 看过 PPO 的算法图 看过 reward / value / policy 的关系 甚至跑过一次训练 但只要你认真问自己一个问题: “PPO 到底在改模型的哪一部分?” 你很可能说不清楚。 你只知道: reward ...
    039 俊琪饰品 发表于 2026-1-27 AI大模型
  • 通义深度搜索-操作指南
    通义深度搜索限时免费中,快来使用吧! 应用开通 1.在阿里云百炼控制台的应用广场中点击通义深度搜索卡片,进入应用详情。 2.首次试用时,点击右上角免费开通完成应用开通。 应用管理 点击我的应用进入应用管理页面。页面展示所有已创建的应用和应用key等信息,首次使用需要新增应用。 应用配置 点击应用卡片或新增应用进 ...
    00 天山玉米 发表于 2026-1-27 AI大模型
  • RAG 的失败,大多在“切文档”那一刻就已经注定
    很多 RAG 项目,在“切文档”这一步就已经失败了 如果你认真复盘过几个 RAG 项目,会发现一个非常残酷、但又极其真实的现象。 很多 RAG 系统: 架构看起来没问题 模型选型也不差 embedding、向量库、prompt 都配置齐全 但效果始终“说不上来哪里对”。 而当你真正把检索出来的 chunk 拿出来,自己一条一条读的时候, 你往 ...
    031 王永争 发表于 2026-1-27 AI大模型
  • 如何通过Java SDK描述Collection
    本文介绍如何通过Java SDK获取已创建的Collection的状态和Schema信息。 前提条件 已创建Cluster 已获得API-KEY 已安装最新版SDK 接口定义 Java // class DashVectorClient public Response<CollectionMeta> describe(String name); 使用示例 说明 需要使用您的api-key替换示例中的YOUR_API_KEY、您的Cluster Endpoint ...
    095 人生苦短急个球 发表于 2026-1-27 AI大模型
  • RAG 不是万能解,这些场景你一开始就不该用
    RAG 最常见的失败,并不是“没效果”,而是“用错地方” 如果你观察过一段时间大模型落地项目,会发现一个非常有意思的现象。 很多团队做 RAG,并不是因为认真分析过需求, 而是因为: “大家都在用 RAG。” 于是 RAG 成了一种默认选项: 有知识问题 → RAG 模型不懂 → RAG 业务效果不好 → 再加一层 RAG 结果就是: 系统 ...
    016 春风送香 发表于 2026-1-26 AI大模型
  • 微调与安全隐私:为什么微调会放大风险
    安全问题,往往不是在“上线那一刻”出现的 如果你做过几次大模型微调项目,很可能有一种错觉。 项目初期,一切看起来都很安全。 数据在内网,模型在内网,访问有权限控制, 甚至你可能会想: “我们又不是直接对外提供服务,哪来的安全风险?” 但很多隐私和安全问题,并不是在模型“上线”那一刻才出现的。 它们更像是 ...
    068 接确产生空间 发表于 2026-1-26 AI大模型
  • Claude-Mem:给 AI 编程助手装上"长期记忆"
    写在前面 你是不是也遇到过这种情况:昨天用 Claude Code 写了一段复杂业务逻辑,今天重新打开项目,AI 助手却像失忆了一样,完全不记得你们讨论过什么,只能从头再解释一遍? 这个痛点,Claude-Mem 给出了解决方案——一个专为 Claude Code 打造的持久化记忆系统,让 AI 助手真正记住你们的每一次协作。 它到底解决了什 ...
    015 我们只有海南一只脚 发表于 2026-1-26 AI大模型
  • 详解大模型安全评估实操流程
    当前,生成式人工智能大模型快速普及,其安全可控性直接关系国家安全、社会公共利益及公民合法权益。根据国家互联网信息办公室等七部门联合发布的《生成式人工智能服务管理暂行办法》(国家互联网信息办公室令第15号)第十七条明确要求,“提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定 ...
    043 一鸣文炖卡拉蛙 发表于 2026-1-26 AI大模型
  • 在复杂任务中如何利用 Claude 4.5 Opus 提高推理精度与响应速度
    在 AI 模型不断发展升级的背景下,Claude 4.5 系列带来了 Sonnet、Opus 和 Haiku 三款子模型,每个模型都有其独特的优势和适用场景。尤其是 Opus 4.5,它以其强大的推理能力和响应速度在复杂任务中脱颖而出。 但对于脚本创作者来说,如何在 推理精度 与 响应速度 之间找到最合适的平衡,仍然是一个需要解决的实际问题。本文 ...
    083 好孩纸 发表于 2026-1-26 AI大模型
  • langchain 快速入门(四):搭建强大的AI Agent
    简介 AI Agent 不仅仅是一个能聊天的机器人(如普通的 ChatGPT),而是一个能够感知环境、进行推理、自主决策并调用工具来完成特定任务的智能系统,更够完成更为复杂的AI场景需求。 AI Agent 功能 根据查阅的资料,agent的功能点如下: Agent = LLM + 规划 + 记忆 + 工具使用 LLM: 用于回答,推理的AI模型 记忆: 短期记忆 ...
    038 吾孙三删吾评 发表于 2026-1-25 AI大模型
  • 下一页 »

    快速发帖

    还可输入 180 个字符
    您需要登录后才可以发帖 登录 | 立即注册

    本版积分规则

    相关侵权、举报、投诉及建议等,请发 E-mail:qiongdian@foxmail.com

    Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

    在本版发帖返回顶部