读大语言模型02聊天机器人(上)
1. GPT
1.1. generative pretrained transformer,即“生成式预训练变换模型”
1.2. “生成式”表明大语言模型不只是像普通深度学习网络那样输出简单的标签,而是能够逐词生成文本内容
1.2.1. 这类模型也常被称为聊天机器人
1.3. “预训练”意味着模型已经通过海量在线和离线文本数据进行了 ...
读大语言模型01导论
1. 导论
1.1. 自2022年ChatGPT惊艳问世以来,大语言模型领域的发展可谓日新月异
1.1.1. 震惊世界的DeepSeek,以及百度的文心大模型、阿里巴巴的Qwen大模型等
1.2. OpenAI于2022年11月面向公众发布了ChatGPT。ChatGPT是一种新型的AI(人工智能)程序,我们称之为大语言模型(large language model, LL ...
langgraph开发Deep Research智能体-项目搭建
前言
大家都说2025年是AI Agent元年,自然agent智能体开发也非常热门。很多公司的所谓的智能体其实是通过扣子、dify这种平台配出来的。就像是通过低代码平台配置出来的web页面一样,虽然能用,但是如果你的需求很复杂,往往平台就无法满足你的需求。作为程序员所以我们还是得需要自己动手来实现智能体,这篇文章我们来讲讲 ...
从经典产品看大模型方向
互联网入行十年左右的人,有一句话应该不陌生:信息化,数字化,智能化。
信息化:把传统线下业务和流程转到线上,通过软件技术管理数据信息,只是各个场景普遍孤立,没有深度整合。
数字化:全部业务流程转到线上,全局整合成闭环的链路,再利用数字化能力,反向重构和驱动业务,优化流程。
智能化:基于信息和数字化的基 ...
"SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering" 论文笔记
介绍
(1) 发表:NIPS'24
(2) 背景
考虑直接与 Linux 终端直接互动的 Agent 的简单设置,我们发现 LM Agent 很难在这种环境下可靠地采取行动。例如,它无法提供简单的命令来编辑一个小文件段,并且如果用户进行无效编辑,则不会提供任何反馈。这些缺陷大大阻碍了性能,激发了对代理计算机接口 (ACI) 的需求,即 LM Agent 和 ...
读AI繁荣01AI之屋
1. AI是驱动第四次工业革命的通用技术
1.1. AI不仅被用作科学家的实验工具,而且开始广泛渗透到日常生活中,重塑着我们的工作、教育、社交、健康乃至情感体验
1.2. 着眼于构建公平、透明且负责任的AI系统,确保技术进步惠及每一个人,尤其是那些在传统社会结构中常被忽视的群体
1.3. AI不再是遥不可及 ...
GPT5写5000行代码,行不行?
GPT5干活扭捏,甚至还想催我搬砖。
一、简介
这几天,试过用国内几款大模型写代码:DeepSeek、Kimi、千问、智谱清言。
测试中最复杂的问题是这样:
使用前端编程语言,开发一款复杂的Web网站,涉及大模型信息采集和展示;进行数据分析,给用户提供有价值的参考;做一个社区板块,可以交流各种模型的使用案例;总共分为3个 ...
欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族!
欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族!
GPT OSS 是 OpenAI 推出的 重量级开放模型,面向强推理、智能体任务以及多样化开发场景。该系列包含两款模型:拥有 117B 参数的 gpt‑oss‑120b 和拥有 21B 参数的 gpt‑oss‑20b。二者皆采用 Mixture‑of‑Experts(MoE)架构,并在 MoE 权重上使用 4‑bit 量化方案 M ...
"ExpeRepair: Dual-Memory Enhanced LLM-based Repository-Level Program Repair" 论文笔记
介绍
(1) 发表:Arxiv 06.12
(2) 挑战
主要探讨了基于 LLM 的 APR 的两个主要类别:代理和程序。尽管这两个范式都表现出希望,但它们依然表现出两个重要的局限性:
忽视历史修复经验:现有方法都忽略了从同一存储库中先前解决的问题中积累的宝贵历史经验,而实际上,软件项目在其演变过程中经常显示出重复的错误模式
静 ...
AI编程:代码多,效果好?
七号楼专栏,大模型测评第01期。
一、简介
2024年AI编程刚有热度,互联网又嗅到降本增效的味道。
入职场到现在,记忆里还有低代码,超级SaaS,数字化转型,大模型,AI应用之编程;这些新概念的出场,都是在各种骂骂咧咧中,深夜王炸的吹嘘声中。
沿着信息化,数字化,智能化的方向持续推进。
在2024上半年,当时还在职场 ...
"AutoCodeRover: Autonomous Program Improvement" 论文笔记
介绍
(1) 发表:ISSTA'24
(2) 背景
软件工程涉及程序改进的过程,特别是软件维护(例如,程序错误修复)和软件演变(例如,功能添加)
自动化程序维修任务对实现自动软件工程愿景的重要性。鉴于自动化程序维修的动机,并且开发人员经常花费大量的时间来修复错误。本工作提出了 AutoCodeRover,实现了 SWE-bench-lite 上的 ...
HRM(Hierarchical Reasoning Model)部署训练记录
前两天朋友刷到HRM这个27M模型的文章,想让我试着部署训练一下。此文用于记录部署过程
前期准备
克隆仓库
sapientinc/HRM
安装CUDA
我的CUDA是已经安装好的12.8版本,安装过程不再赘述
安装torch
torch版本如下 Version: 2.7.1+cu128
pip install torch torchvision torchaudio -f https://mirrors.aliyun.com/pytorch-whee ...
"When Large Language Models Confront Repository-Level Automatic Program Repair How Well They Done" 论文笔记
介绍
(1) 发表:ICSE'24
(2) 背景
APR 任务的这些模型的当前评估仅关注错误所在的单个功能或文件的有限上下文,从而忽略了存储库级上下文中的有价值信息。现有的数据集要么不是在存储库中构建的,例如 Quixbugs,要么无法准确恢复存储库级错误的方案,例如 Defects4J。本文研究了流行 LLM 在处理存储库级维修任务中的性能
( ...
Git工作面试必知必会操作-命令行篇
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 下载安装及 ...
cursor1.3 重大更新!复刻 claude code!
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
与Agent共享 ...
cursor1.3 重大更新!复刻 claude code!
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
与Agent共享 ...
IT文档中总出现的 hooks 是什么 钩子 回调
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 前言
引用 ...
【Datawhale AI夏令营--task2】科大讯飞AI大赛(大模型技术)
进入baseline2 开启python编码阶段啦
感想:
开始的晚了一些,准备环境花了好久哦,好在ai可以帮忙安装环境需要的各种包,并且运行的报错也可以解决。
以及硅基流动的免费api超级慢TT,遍历数据花费的时间过长了。
听到分享会上可以用阿里百炼的api,但在调用上还有些问题,接下来要再多试一下。
阅读了一下代码,发现代码 ...
CocoIndex实现AI数据语义检索
1.概述
在AI场景中,数据的高效处理与实时更新是推动技术突破的关键基石,而高性能的数据转换框架则是连接数据与 AI 应用的重要桥梁。CocoIndex 作为一款适用于人工智能的超高性能实时数据转换框架,凭借其独特的增量处理功能,在数据处理领域展现出显著优势。它不仅能实现数据的实时转换,更在数据新鲜度上实现了质的飞跃 ...
Visual Studio Copilot 全面升级:更智能的默认模型、多模型切换、更便捷的使用管理
作为全球最受欢迎的集成开发环境之一,Visual Studio 一直致力于为开发者提供高效、智能的开发体验。无论是构建现代 Web 应用、跨平台移动应用,还是进行企业级系统开发,Visual Studio 都凭借其强大的调试工具、智能代码提示、丰富插件生态和云端协作能力,成为众多开发者首选的生产力平台。
近年来,随着 AI 助 ...