收藏本版 |订阅

AI大模型 今日: 0|主题: 313|排名: 11 

  • iNeuOS工业互联网操作系统集成大模型智库(iNeuOS_AiMind·心智灵慧) New
    1. 概述     iNeuOS工业互联网操作系统作为工业数字化底座,长期面向设备采集、数据处理、数据分析、报警监控、远程控制和业务应用集成等场景提供统一的平台能力。在工业现场,数据分散、经验分散、知识分散往往是企业推进智能化升级时遇到的第一道门槛。     随着模型智库模块“iNeuOS_AiMind·心智 ...
    184 芮宁 发表于 昨天 12:08 AI大模型
  • 大模型基础(四):强化学习入门-从斯金纳箱到大模型推理 New
    2025年图灵奖颁给了强化学习的奠基人Richard Sutton和Andrew Barto。为什么强化学习如此重要?它如何从训练老鼠变成训练大模型?这篇文章带你一探究竟。 一、一个老鼠实验引发的革命 1.1 斯金纳箱:强化学习的源头 1930年代,心理学家斯金纳做了一个著名实验: 实验过程: 把一只老鼠放进箱子 箱子里有一个杠杆 老鼠偶 ...
    066 韬爷 发表于 前天 07:30 AI大模型
  • Hy-MT1.5-1.8B-2bit:腾讯开源 574MB 能打败 72B 巨人的移动端翻译模型 New
    Hy-MT1.5-1.8B-2bit:Tencent 开源 574MB 能打败 72B 巨人的移动端翻译模型 TL;DR Hy-MT1.5-1.8B-2bit 是腾讯混元团队推出的突破性 2-bit 量化翻译模型,将 3.3GB FP16 模型压缩至仅 574MB,同时保持世界级翻译质量 基于腾讯自研的 SEQ(Stretched Elastic Quantization,弹性延伸量化) 技术,属 AngelSlim 压缩工具包的 ...
    084 九杀 发表于 6 天前 AI大模型
  • 彻底解决大模型 JSON 报错:提示词 + 硬约束 + 兜底的全链路修复方案 New
    众所周知,大模型的核心原理是『文字接龙』,通过概率计算输出下一个 Token,这种机制天然存在幻觉问题,导致模型会一本正经的胡说八道。 当要求大模型输出 JSON 格式时,也常因为幻觉问题遇到各种格式灾难: 附带冗余话术:比如前后夹带“好的,这是你要的结果”、“以下是符合要求的JSON”。 Markdown 标签包裹:带有 ...
    071 脾气不大 发表于 7 天前 AI大模型
  • Windows平台下CUDA安装及llama.cpp使用教程 New
    本文将详细讲解Windows平台下,如何安装与NVIDIA RTX显卡匹配的CUDA工具包,并正确配置、使用llama.cpp加载大模型,实现模型高效运行(将模型几乎全放入显卡,提升推理速度),全程结合实操截图与具体命令,新手可直接跟着操作。 1.首先需要下载与RTX对应的CUDA驱动,此处必须保证完全一致,执行nvidia-smi命令获取版本信息 ...
    015 他爹 发表于 7 天前 AI大模型
  • LangChain框架-基础
    1.LangChain是什么? LangChain 是⼀个⽤于开发---> 由(⼤型语⾔模型(LLMs)驱动的应⽤程序)的框架。 简单来说理解就是一个用开发开发大模型应用的开发框架,内部集成了很多功能,也有很多第三方生态扩展,用起来事半功倍,就把他想象成C#中的.NET Core框架,go中的Gin。 它简化了大语言模型应用程序生命周期的各个阶 ...
    044 裸奔向前 发表于 2026-4-24 AI大模型
  • 方差在扩散模型保护中的作用
    Variance in Adversarial Attack for Customized Diffusion Models IDProtector:一种对抗性噪声编码器,用于防范保留身份的图像生成 Related Works Tuning-based Customized Generation DreamBooth, Custom Diffusion, LoRA and Textual Inversion 需要多图像微调,它们需要大量的计算资源和时间 Encoder-based ID-Preserv ...
    084 荦确 发表于 2026-4-21 AI大模型
  • Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平
    Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平 TL;DR Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型,采用稀疏 MoE 架构,35B 总参数但每 token 仅激活 3B Apache 2.0 许可证,完全开源可商用 在 Terminal-Bench 2.0 得分 51.5(vs Gemma4-31B 的 42.9),SWE-bench Verified 得分 73.4 ...
    075 之一的之一 发表于 2026-4-17 AI大模型
  • 做 AI 应用必懂:Function Call 和 Skills,到底差在哪?
    前言 今天来详细讨论一下,function call 和 skills。function call 到底是什么,skills 到底是什么,它们分别解决什么问题,最本质的区别在哪,以及在 Agent 系统里该怎么配合 function call function call 的本质,是让模型以工程化的方式调用某个具体工具或函数 以前模型想调用外部能力,通常只能口头表达——比如它输 ...
    022 东北仙儿哥 发表于 2026-4-14 AI大模型
  • 先免费试用下Claude code安装使用(教程)
    🧑‍💻 写在开头 点赞 + 收藏 === 学会🤣🤣🤣 2026年了,如果还不会使用一款AI编程工具,未来将会越来越难行。 今天我们先来使用一个终端编程比较火的工具:Claude code 一、安装 1、nodejs安装 如果你本地没有node环境,是需要先安装node的,node版本至少要18.0以上,可点击下面地址跳转到nodejs官网下载下载Node.js ...
    065 肖兴中 发表于 2026-4-14 AI大模型
  • LlamaIndex高级RAG实战:从检索增强到知识图谱问答
    一、RAG的局限与高级RAG 基础RAG(检索增强生成)存在明显短板:检索精度低、缺乏多跳推理、无法处理复杂查询。高级RAG通过查询改写、重排序、知识图谱增强等技术,将RAG从简单检索提升到深度问答。LlamaIndex是构建高级RAG系统的首选框架,提供丰富的索引结构和检索策略。 二、LlamaIndex核心架构 核心组件: - Document/N ...
    072 南极磁场 发表于 2026-4-14 AI大模型
  • AI应用-提示词工程
    1.什么是提示词和提示词工程? 提示词和提示词工程 提示词如何理解就是我们对大模型说的每一句话都是Prompt,例如咱们使用DeepSeek或者某包上面问一些问题,或者给出一些指令,而大模型跟你来回交互,其实就是在续写你给他的提示词(Prompt),当然也可以理解为用来引导模型输出特定的回答,或者做一些任务的一组词语。 提示 ...
    046 脆轻松 发表于 2026-4-12 AI大模型
  • DeepSeek-V3 + Spring Boot实战:10分钟接入国产大模型API
    一、DeepSeek-V3 简介 DeepSeek-V3是深度求索推出的最新大语言模型,在代码生成和中文理解上表现优异。其API兼容OpenAI格式,开发者可零成本迁移。本文将手把手演示Spring Boot接入DeepSeek-V3 API。 二、获取API Key 1. 访问 platform.deepseek.com 注册账号 2. 进入API Keys页面,点击创建API Key 3. 复制Key(格式:sk-x ...
    059 丁如意 发表于 2026-4-12 AI大模型
  • 别再混着用了:agent 和 workflow 到底有什么区别?
    前言 一个agent,一个workflow。很多朋友在群里一聊就是“我搞了个 agent”,结果仔细一看,其实只是配了个固定流程;也有老哥把本该交给 workflow 的事,硬塞给 agent,最后调了半天,成本起飞,效果还不稳定 所以这篇文章,笔者就把 agent 和 workflow 的区别掰开揉碎了讲清楚 基本概念 workflow 是什么 说白了,它像流水 ...
    039 渐进 发表于 2026-4-10 AI大模型
  • LLM微调实战:用LoRA让大模型更懂你的业务
    一、为什么需要微调? 预训练大模型(如GPT、Llama、Qwen)具备强大的通用能力,但在垂直领域往往表现不佳。微调(Fine-tuning)通过在特定领域数据上继续训练,让模型"学会"你的业务知识、术语和风格。 二、LoRA为什么是最佳选择? LoRA(Low-Rank Adaptation)的核心思想是:冻结预训练模型的原始权重,只训练两个低秩矩 ...
    030 话很少 发表于 2026-4-8 AI大模型
  • Context 工程:如何把正确的上下文喂给 AI
    我们在项目中一定都遇到过,AI 明明很"聪明",工具也都接好了,结果你让它改个 bug,它改的完全不是你想要的文件;你让它写个组件,它生成了一套跟项目风格完全不搭的代码。 这不是 AI 笨,也不是工具不行,「而是你"喂"给它的上下文不对。」 你可以把 AI 想象成一个远程结对编程的同事——他水平很高,但「他只能看到你屏 ...
    07 雪山之松 发表于 2026-4-8 AI大模型
  • 深度解析Claude Code 51万行源码背后的设计实现
    最近发生了一件非常大的事情,全球最强的AI编程工具Claude Code,因为Anthropic的一个低级失误——打包npm包的时候忘了删source map文件——51万行源代码,全部暴露在互联网上。 几个小时之内,代码就被全世界的开发者下载、镜像、拆解。Anthropic紧急下架了包,但互联网没有删除键。因为 Claude Code 意外泄露了 sour ...
    06 不如春风 发表于 2026-4-7 AI大模型
  • OpenClaw AI助手本地部署完整教程
    换了套本地AI工具,叫OpenClaw。用了一段时间,稳定性不错,扩展性也比我预期的好用。顺手整理了份部署教程,给想尝鲜的朋友参考。 一、什么是OpenClaw OpenClaw是一个本地的AI助手框架,核心能力是多Agent协作。 你可以把它理解成:一个Gateway(网关) + 多个专业Agent(专家)。每个Agent专注一个领域——写作、编程、表 ...
    097 养鸡场年久失俢 发表于 2026-4-6 AI大模型
  • 分布式智能体|A2A Agent实战
    随着智能体应用的广泛应用,智能体的分布式部署、跨网络、跨框架、跨组织调用,成为当下智能体落地急需解决的问题。针对这一痛点,Google推出了Agent2Agent(简称A2A)协议,专为智能体之间的互联互通、协同协作提供标准化的解决方案。 本文基于Spring AI Alibaba框架,使用Nacos作为注册中心,落地完整的分布式智能体方案 ...
    061 秋潭之水 发表于 2026-4-2 AI大模型
  • 向量数据库实战:Milvus入门与Java集成
    前言 向量数据库是 RAG 系统的核心组件,负责存储和检索高维向量数据。Milvus 是最流行的开源向量数据库,支持十亿级向量检索。本文带你快速入门 Milvus,并完成 Java 集成。 一、Milvus 核心概念 Collection:向量数据的集合,类似数据库中的表 Partition:集合的分区,提升查询性能 Vector Field:存储向量数据的字段 In ...
    096 永远的光辉 发表于 2026-4-2 AI大模型
  • 下一页 »

    快速发帖

    还可输入 180 个字符
    您需要登录后才可以发帖 登录 | 立即注册

    本版积分规则

    相关侵权、举报、投诉及建议等,请发 E-mail:qiongdian@foxmail.com

    Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

    在本版发帖返回顶部