收藏本版 |订阅

AI大模型 今日: 0|主题: 313|排名: 11 

  • Spring with AI (3): 定制对话——Prompt模板引入
    本文代码:https://github.com/JunTeamCom/ai-demo/tree/release-3.0 Spring with AI系列,只关注上层AI的应用程序(基于JAVA搭建),不关注底层的LLM原理、搭建等技术。 通过简单的自定义Prompt模板,即可定制一个AI,专注某一领域的知识回答。 1 创建模板 先在pom.xml引入验证Starter: <dependency> <groupId>org.spr ...
    059 水煮鸡蛋 发表于 2026-3-17 AI大模型
  • CLIP:连接视觉与语言的桥梁
    什么是 CLIP? CLIP(Contrastive Language-Image Pre-training,对比语言-图像预训练)是 OpenAI 提出的一种多模态预训练模型。它采用对比学习和双塔架构,实现了视觉与语言的统一表征。 CLIP并不像是一种模型,更像是一种方法,一种通用的将计算机视觉模型与自然语言处理领域模型结合的方法 为什么需要 CLIP? 传统的图 ...
    020 执笔写余生 发表于 2026-3-15 AI大模型
  • 深入理解 Transformer:从数据流动看模型架构
    论文链接:Attention Is All You Need 这篇论文提出了 Transformer 模型架构,这是一个序列到序列的模型,在论文中被应用于英德和英法两个机器翻译任务。 由于 Transformer 被用于翻译任务,整个模型的输入维度是 (batch_size, seq_len)​,输出维度是 (batch_size, seq_out_len)。模型采用 Encoder-Decoder 架构,下面是模 ...
    06 燉燉妈妈 发表于 2026-3-14 AI大模型
  • 强化学习基础(RL)笔记
    RL 简介 (1) 定义 强化学习(Reinforcement Learning)是一种机器学习方法,用于解决需要在一定环境下通过与环境交互来学习最有行为策略的问题。其核心思想是通过试错和奖励机制来指导智能体(Agent)学习如何在不同情境下采取行动,以最大化长期累积奖励 (2) 强化学习流程 强化学习中的 agent 用来表示做决策的机器,相比 ...
    095 不用掩饰 发表于 2026-3-13 AI大模型
  • AI时代,人人都是系统设计工程师
    AI时代,人人都是系统设计工程师 AI时代,你可以让AI替你打工。最近OpenClaw很火,它可以承担产品、UI、程序员、测试等一系列职责,这些工作你都可以交给它来完成。但AI还是需要人来给它意图和指令,否则AI也不知何去何从。 随着AI能力的提升,软件开发中的岗位边界正在变得模糊。传统意义上的产品、UI、前端、后端、大数据 ...
    078 黄河大李鱼 发表于 2026-3-11 AI大模型
  • Stanford-CS336-Lecture-02 Pytorch
    本内容为Stanford CS336 Lecture 02,主要不是为pytorch的所有方法进行详细的讲解,而是提供对pytorch的一些必要的、角度不一样的理解。视频链接如下: 【中英字幕完结】斯坦福CS336:从头开始构建大模型 _ 2025年最新 - 2.第2集:pytorch手把手搭建LLM_哔哩哔哩_bilibili 1.tensor的数据类型 tensor又称张量,可以认为是计 ...
    026 飘渺李煜 发表于 2026-3-10 AI大模型
  • Gemini 3.1 Flash-Lite 正式上线:专为规模化智能而生
    内容来源于谷歌官方,由谷歌云谷歌地图合作伙伴 CloudAce 深圳云一进行翻译发布。 导语: Google 扩展了 Gemini 3 模型家族,正式推出 Gemini 3.1 Flash-Lite。作为该系列中速度最快、性价比最高的模型,它专为应对大规模高容量的开发工作负载而设计,在模型等级与价格平衡方面树立了新的行业标杆 。 目前,开发者已可通过 ...
    089 舒凡人生 发表于 2026-3-10 AI大模型
  • ‍装了 OpenClaw 后,信用卡被盗刷了...
    前两天有个哥们发现自己信用卡被盗刷了。 他慌了,让自己部署的 OpenClaw 帮忙排查一下到底怎么回事。 龙虾查了一圈,回复他: 你没看错。这是 AI 回复的。 这哥们给自己的 OpenClaw 取名叫"顾衍",一只有名有姓的 AI 龙虾,查完安全日志之后,第一反应是骂了一句街。 用户让它继续查到底是哪里出了问题。龙虾先排查了 SS ...
    089 胖鸵鸟 发表于 2026-3-9 AI大模型
  • 监督微调(SFT)笔记
    SFT 简介 (1) 什么是监督微调 监督微调(SFT)通过利用特定于任务的标签数据集将预训练的 LLM 适应特定任务。SFT 的数据集通常组织如下,一条样本包含一个指令和对应的回答:\(D=\{(I_K,A_K)\}_{K=1}^N\) (2) 监督微调和预训练的区别 在训练方式上没有任何区别,损失函数一样,主要区别在于数据的组成形式上: 预训练的每 ...
    0100 我的人生不能将就 发表于 2026-3-9 AI大模型
  • OpenClaw中级到高级教程
    OpenClaw从"能用"迈向"好用"的关键跨越。下面这份教程将涵盖你关注的记忆系统、网络搜索、服务器部署、接入微信/飞书、安装skills、多Agents功能,并补充心跳机制的说明,帮你系统性地掌握这些进阶能力。 一、记忆系统优化:从记录到智能检索 基础记忆依赖Markdown文件,存在"失忆"和检索困难的问题。进阶记忆系统通过分层 ...
    056 一个劲儿的巴巴 发表于 2026-3-8 AI大模型
  • 女生必看!用OpenClaw'龙虾'当你的24小时免费助理,职场、生活效率翻倍,做自己的女王!
    🌟 前言 在职场和家庭中,女性常常身兼数职——职场精英、家庭主妇、孩子的妈妈...时间总是不够用。今天我要介绍一个超级好用的AI助理——OpenClaw(龙虾),24小时为你待命,帮你搞定每一件琐事! 🦞 什么是OpenClaw? OpenClaw是一个开源AI Agent平台,别名"龙虾"。它就像一个全能的私人助理,能够: ✅ 24小时在线服务 ...
    06 量体截衣 发表于 2026-3-7 AI大模型
  • 🔥阿里开源神器!一行代码让网站秒变 AI 原生应用,Page-Agent 太强了!
    前言 最近发现了一个超厉害的开源项目——Page-Agent,这是阿里巴巴开源的浏览器内 GUI Agent 框架,只需要一行代码就能让你的网站秒变 AI 原生应用!今天就来给大家详细扒一扒这个神器。 什么是 Page-Agent? Page-Agent 是一个纯前端的浏览器内 GUI Agent 框架,它的核心理念是:让任何网站都能轻松集成 AI 能力,无需后 ...
    049 年轮虎 发表于 2026-3-7 AI大模型
  • AI 工程化实战:拒绝“开盲盒”,像写代码一样搞定提示词工程!
    本文全面介绍了提示词相关内容,包括提示词工程的重要性,如何写好一个提示词,以及使用 Coze 平台进行实操,适合零基础小白入门。 面对汹涌而来的 AI 浪潮,很多研发同学感到焦虑。但其实,对于非算法背景的我们来说,不需要成为研发「发动机」的算法科学家,而是要成为能够驾驭「赛车」的 AI 工程师。 今天,我们就来学 ...
    034 看繁花落尽 发表于 2026-3-6 AI大模型
  • centos7安装部署openclaw
    在 CentOS 7 上安装部署 OpenClaw(一个开源的《百战天虫》(Worms)风格游戏,基于 Java 编写)需要完成以下步骤。由于 OpenClaw 是用 Java 编写的,主要依赖 Java 运行环境和一些图形/音频库。 一、系统准备 确保你的 CentOS 7 系统是最新的: sudo yum update -y 安装常用工具(如 wget、git、unzip 等): ...
    055 凫跃 发表于 2026-3-6 AI大模型
  • OpenClaw 安装配置指南:从零开始在 Telegram 和飞书中使用 AI 助手
    前言 最近开始使用 OpenClaw,一个开源的 AI 助手框架,可以让我们在自己的服务器或本地运行 AI 助手,并接入多种消息平台。本文记录了我在安装配置 OpenClaw 并接入 Telegram 和飞书的过程,希望对有同样需求的朋友有所帮助。 一、什么是 OpenClaw? OpenClaw 是一个开源的 AI 助手框架,支持: 多模型支持:可以接入 Cla ...
    048 心溢 发表于 2026-3-3 AI大模型
  • AIGC图像困局
    AIGC图像困局 算法技术的历史,是"用小资源干大事"的心酸历。 在写深度学习优化器算法巧思速览之前其实本来计划是先写现在这篇的,只是那个时候手上热乎的思路还是优化器相关,所以这篇博文就延后到今天才写。 这个标题起得很大,真写起来,篇幅真的太长了,所以只能想到哪写到哪。 2012年,Alex Krizhevsky的AlexNet在Im ...
    027 徐州王健林 发表于 2026-3-2 AI大模型
  • 一文读懂MOE:大模型背后的"专家分工"智慧
    一文读懂MOE:大模型背后的"专家分工"智慧 本文基于综述论文:A Comprehensive Survey of Mixture-of-Experts Algorithms, Theory, and Applications(Siyuan Mu and Sen Lin)。如需深入了解,建议阅读原文。 重点内容 MoE(混合专家模型) 是当前大模型扩展的核心技术之一,DeepSeek、Mixtral、GPT-4 等明星模型都在用 ...
    098 用户晴天 发表于 2026-2-27 AI大模型
  • AI 工程化实战:不学算法也能用好的 LLM 指南
    本文全面介绍了大模型相关知识,包括大模型(LLM)、提示词工程(PE)、检索增强生成(RAG)、工具调用(Function Calling)、模型上下文协议(MCP) 等,适合零基础小白入门。 近些年,AI 的发展速度越来越快,越来越多的业务开始寻求“AI 赋能”。面对这个黑盒,很多研发人员的反应是疑惑:“我需要学习神经网络算法 ...
    085 瑞福源大碗面 发表于 2026-2-25 AI大模型
  • 腾讯云部署OpenClaw并集成Telegram机器人
    1 项目安装部署 1.1 购买腾讯云 首先需要购买腾讯云的“轻量应用服务器”,如果是新用户价格还是比较实惠的,最低配置版本一年只需要99元,但是如果是老用户最便宜的是30元/月,比阿里云最低配的还要贵一些。 出于性能考虑,买的是199元/年的这款,为了正常流畅的下载github上相关项目,地域这里选的是东京,操作系统选的 ...
    067 潘群峰 发表于 2026-2-25 AI大模型
  • LLM应用测试,终于有了趁手武器?深度评测Product Hunt爆火的LLM Testing Tool
    摘要 最近Product Hunt上冒出了一批LLM测试工具,我试用了三天,说实话:有些是真香,有些是鸡肋。本文从测试工程师视角,深度评测BenchLLM、Langtail、Giskard三款热门工具,并结合LLM测试的"三重地狱"(幻觉、偏见、泄露)痛点,给出选型建议和实践经验。 背景引入 说实话,去年我接手公司第一个LLM项目时,完全不知道该 ...
    01 搓衣板 发表于 2026-2-24 AI大模型
  • 下一页 »

    快速发帖

    还可输入 180 个字符
    您需要登录后才可以发帖 登录 | 立即注册

    本版积分规则

    相关侵权、举报、投诉及建议等,请发 E-mail:qiongdian@foxmail.com

    Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

    在本版发帖返回顶部