大模型到底在干嘛
本周,谷歌官方推出了一款苹果手机 App,为手机提供离线使用的 Gemma 4 模型。不需要上网,手机也能使用大模型了。
大模型到底在干嘛大多数人已经在用 AI 了:写周报、改文案、查资料。
但用着用着,往往会冒出一个更实际的问题——
👉 这玩意儿到底在“干嘛”?它是真的在“思考”吗?
一、先说结论:它本质是在“猜下一个字”如果只用一句话总结:
👉 大模型做的事情,其实就是:根据前面的内容,预测接下来最可能出现的词。
听起来很简单对吧?但关键在于——它不是随便猜,而是基于海量数据训练出来的“高水平猜测”。
举个简单例子:
当看到一句话:
今天天气很好,我准备去_____
我么大概率会填:
公园
散步
逛街
而不会填:
修火箭
挖隧道
为什么?因为我们“见得多”,知道正常人会怎么说。
👉 大模型干的就是同一件事,只不过它见过的是“全世界级别的数据”。
二、它为什么看起来“像懂了”?有时候可能会有一种感觉:
👉 AI有时候说话特别像人,甚至感觉它“理解了”。
但实际上,它并不是像人一样在理解,而是:
👉 它太会“模仿人类说话方式”了。
可以把它想象成:
一个看 ...
Claude 内部提示词手册公开(精选10条)
在ClaudeCode中输入提示词后发生了什么有人根据 Claude Code 泄漏的源码制作了网站,能一步步图解演示输入提示词后软件内部如何处理。
网站地址:https://ccunpacked.dev/#agent-loop
Claude 内部提示词手册公开文档来源:@meijiangAI(Anthropic 前研究员公开的内部提示词)
提示词1:情境简报核心理念:永远不要直接提问,先给 Claude “地图”。
推荐提示词:
1234我的背景是:[你的角色、公司、具体问题]。 已尝试过:[X、Y 等方法]。 目前卡在:[Z 具体难点]。 帮我理清思路。
效果:内部测试显示,此做法可提升 41% 的输出质量。 Claude 需要清晰的情境才能进行高质量导航。
提示词2:推理要求核心理念:不要只问答案,要问思考过程。
推荐提示词:
123给出方案前,逐步展示你的推理。 指出所有不确定之处。 标记所有假设。
效果:让 Claude 的内部推理层完全浮现。你不仅得到答案,还能得到可验证、可质疑的思考过程。
提示词3:诚实约束核心理念:Claude 天性过于“乐于助 ...
AI现阶段常见新词汇出现背景(二)
微信已开放龙虾接口微信官方本周发布了龙虾接口,意味着我们可以通过微信来操控龙虾了。
很多项目利用这个接口做二次开发,便于各种 Bot 和 Agent 网关的接入。
wechat-rs-sdk
WeChatBot
WeClaw
WeChat-Channel
AI应用常见新词汇本篇进一步探讨那些支撑复杂AI系统的新技术和术语,例如MCP、Function Calling、Multi-Agent等。
这些技术的出现有一个共同原因:大模型本身只是提供“一问一答”的能力。在实际应用中,我们需要让AI能够处理多步骤任务、跨系统协作、长文档理解,以及复杂业务逻辑。于是便以大模型为基石,开发了各类辅助技术,使AI不仅能说话,还能“做事”。
就像几十年前,当电力技术出现后,人们不仅点亮了灯泡,还基于电力发明了电视、电冰箱、电梯、计算机网络等一系列应用。大模型同样是AI的“电力”,为衍生技术提供了基础,让整个AI生态迅速丰富并得以发展。
一、Function Calling(函数调用)出现背景大模型本身只能生成文本,但在实际应用中,我们希望AI能够:
查询数据库
调用接口
执行业务逻辑
因此引入了 ...
AI现阶段常见新词汇出现背景(一)
全球AI使用现状世界总人口现在是81亿,如果画成一个方块图,每个方块代表320万人。
68.8亿人还从没用过 AI(灰色方块),占84%。
13.8亿人跟 AI 有过对话(绿色方块),占16%。
1500万~2500万人付费订阅了 AI 服务(黄色方块),占0.3%。
200万~500万人使用 AI 生成了自己的编程项目(红色方块),占0.04%。
图片数据截至2026-03-06前有效
AI应用常见新词汇随着大模型技术的发展,AI领域在近两年出现了大量新的技术词汇,例如:LLM、Prompt、RAG、Agent等。这些概念不仅出现在技术文章中,也逐渐进入企业应用场景。
理解这些核心术语的出现原因,有助于更好地理解当前AI系统的工作方式以及未来的应用方向。
一、LLM(Large Language Model,大语言模型)出现背景在早期的自然语言处理(NLP)领域,模型通常只能完成单一任务,例如:
情感分析
文本分类
机器翻译
每个任务都需要单独训练一个模型,开发成本较高,通用性也较差。
随着深度学习的发展,研究人员开始训练参数规模更大的通用语言模型,通过海量文本数据进行训练 ...
Windows 下 OpenCV 编译与 GoCV 安装实战
概述在 Windows 平台上,如果你想从源码编译 OpenCV 并在 Go 语言中通过 GoCV 使用它,这篇文章会带你一步步完成:准备工具、编译 OpenCV、安装 GoCV 到运行验证,流程亲测可用,并附常见坑与排错建议。
一、准备工具:安装 MinGW 与 CMake在正式编译之前,需要准备两个工具:
MinGW‑w64(GCC 编译器)
CMake(生成构建系统)
在命令提示符中创建目录:
123c:md mingw64md cmake
下载并解压:
MinGW‑w64:选择 “GCC-8.1.0” 的 “x86_64-posix-seh” 版本,解压到 C:\mingw64
CMake:下载 “Windows x64 ZIP” 版本,解压到 C:\cmake
将以下路径加入系统 PATH,并重启命令行:
1setx PATH "%PATH%;C:\mingw64\bin;C:\cmake\bin"
验证安装:
12gcc --versioncmake --version
如果看到 “gcc version 8.1.0 …” 与 “cmake ...
CookLikeHOC:用老乡鸡的方式烹饪美味,轻松上手的JavaScript项目!
🍳 CookLikeHOC:用老乡鸡的方式烹饪美味,轻松上手的JavaScript项目!你是否曾在厨房中苦苦挣扎,想要重现那一份来自老乡鸡的美味?是不是在尝试几次后,依然对自己的厨艺感到无奈?别担心,今天我们要介绍的项目——CookLikeHOC,将会把你变成烹饪高手,让你轻松驾驭各种美味佳肴!🥢
项目介绍CookLikeHOC 是一个非官方的老乡鸡菜品烹饪项目,致力于将《老乡鸡菜品溯源报告》的内容进行归纳、编辑与整理,使每一个热爱美食的人都能在家中轻松复刻出那些令人垂涎的菜肴。项目的主要部分预计于2024年完工,但已经吸引了近9517个星标和1300个新星标的热情关注,充分说明了它的受欢迎程度!🌟
技术特点1. 基于JavaScript的易用性CookLikeHOC采用了JavaScript语言,开发者们可以轻松地上手,结合各种现代前端技术,快速实现自己的烹饪应用!无论你是前端小白还是资深开发者,都能在这个项目中找到乐趣🏗️。
2. 数据驱动的烹饪体验
项目不仅仅是简单的菜谱展示,更是通过数据驱动的方式,让用户了解每道菜的来源、材料以及烹饪技巧。这种透明化的信息传递,让你在烹 ...
SQLBot:问数新纪元的智能助手 🚀
SQLBot:问数新纪元的智能助手 🚀在这个数据驱动的时代,如何高效地从海量数据中提取有价值的信息,成为了企业和个人的共同挑战。传统的SQL查询方式不仅复杂,而且对普通用户来说,有着不小的门槛。想象一下,如果你只需用自然语言提问,系统便能自动生成SQL查询语句,轻松获取所需的数据,这将是多么美好的事情!今天,我要向大家介绍一款极具潜力的开源项目——SQLBot,它正是为解决这一痛点而生!✨
项目概述
SQLBot 是一个基于大模型和RAG(Retrieval-Augmented Generation)技术的智能问数系统。它能够将自然语言转换为SQL查询,帮助用户轻松获取数据,极大地提升了数据查询的便捷性和准确性。目前,该项目在GitHub上拥有超过2052个星标,并且今日新增了121个星标,显示出其越来越受到开发者和用户的欢迎。
项目地址:dataease/SQLBot
技术特点
开箱即用SQLBot 只需进行简单的配置,即可与大模型和数据源连接,快速启动问数之旅。用户无需具备SQL知识,便可通过简单的自然语言与系统进行交互,轻松获取数据。
易于集成SQLBot 支持 ...
什么是NAT?NAS远程访问绕不开的网络魔法
一、前言你是否曾经困惑过:家里的NAS明明连上了网,为何我在外地却访问不到?为什么别人能通过公网IP访问他们的设备,而我却只能在局域网里摸鱼?
这一切的答案,都指向了一个看似神秘却无处不在的网络技术:NAT(网络地址转换)。
本文将为你揭开NAT的面纱,从原理到实际应用,帮助你理解它在家庭网络、NAS远程访问中的关键作用。
二、什么是NAT?NAT,全称是 Network Address Translation(网络地址转换),顾名思义,是一种IP地址转换的技术。
通常用于私有网络(局域网)和公网(互联网)之间的地址转换,其使命是解决IPv4地址不够用的问题。
举个例子:我们家的路由器获取到了一个公网IP,例如 123.123.123.123,而家中所有设备(NAS、手机、电脑)使用的都是内网地址,比如 192.168.1.2、192.168.1.10 等。
这些内网IP无法直接在互联网中通信,于是由路由器扮演翻译官的角色:通过NAT机制,把所有设备的访问请求“伪装”成来自 123.123.123.123,再转发到公网。
三、NAT的工作原理1. 出站请求流程(从内网访问公网)以 NA ...
MySQL慢SQL处理
概述Docker 环境下使用 pt-query-digest 分析 MySQL 慢查询。
在生产或测试环境中,MySQL 查询变慢往往是性能问题的信号。要精准定位问题,分析慢查询日志是最直接有效的方式。本文介绍如何在 Docker 环境中启用慢查询日志,并使用 pt-query-digest 进行深入分析与优化。
一、前提条件
MySQL 运行在 Docker 容器中。
能进入容器或通过挂载访问日志文件。
主机或容器中可使用 pt-query-digest 工具(Percona Toolkit 提供)。
如果 pt-query-digest 尚未安装,可在常见发行版中安装:
12345# CentOS / RHELyum install -y percona-toolkit# Debian / Ubuntuapt install -y percona-toolkit
若系统源中没有,可通过 Percona 官方源安装:
123wget https://repo.percona.com/yum/percona-release-latest.noarch.rpmrpm -ivh per ...
向量数据库介绍
向量数据库(Vector Database)是近年来随着大语言模型(LLM)和语义搜索发展而火起来的一种新型数据库。它的目标是支持基于“语义相似度”的高效搜索,与传统数据库按关键字精确匹配不同。
🧠 一、什么是“向量”?
在 AI/NLP 中,一段文本、图像、音频都可以被编码为一个高维的浮点数数组,比如:
1"Java 是一种面向对象的编程语言" → [0.12, -0.33, 0.88, ..., 0.03] // 1536维
这个过程叫做 Embedding(嵌入)
转换之后的向量保留了原始内容的语义信息
两个意思相近的句子,它们的向量会在高维空间中非常接近
📚 二、向量数据库 VS 传统数据库
特点
传统数据库 (MySQL)
向量数据库 (Weaviate/Pinecone)
存储的数据
字符串、数字等
高维向量(float 数组)
支持的搜索方式
精确匹配、模糊匹配
向量相似度搜索(余弦/欧几里得)
应用场景
业务数据管理
语义搜索、图像检索、文档问答
🔍 三、向量数据库的核心功能✅ ...
