本文详细介绍了9大类型、50个实用的AI Agent开源工具,包括计算机与浏览器操作、框架、语音、文档理解、记忆、测试与评估、监控与可观测性、仿真环境和垂直领域Agent。这些工具可以帮助开发者构建和优化AI智能体,提高开发效率。
标签 大模型 下的文章
- 首页
- 大模型
2025年6月AI资讯汇总显示,AI技术在多个领域取得突破,包括谷歌Gemini 2.5 Pro模型、Anthropic的Claude 4系列模型、DeepSeek-R1-0528版本、腾讯混元图像2.0、中国石油昆仑大模型等。新产品与应用方面,PixVerse、快手、Opera、京东工业、Mini...
随着AI技术的发展,地球上的数据中心电力需求激增,能源瓶颈难以解决。因此,越来越多的公司和投资者开始考虑在太空中建立数据中心,利用太阳能满足能源需求。美国初创公司Starcloud计划今年8月发射搭载英伟达H100芯片的卫星,这将是第一颗轨道数据中心。尽管面临技术与经济挑战,但轨道数据中心的初期应用...
本文是《从零开始的大语言模型原理与实践教程》第七章,介绍了大模型的应用。首先,讨论了大模型评测的重要性,包括评测数据集和主流评测榜单。然后,介绍了检索增强生成(RAG)技术,包括其基本原理和搭建RAG框架的步骤。最后,讨论了LLM Agent的概念、类型,并提供了一个简单的任务导向型Agent的实现...
本文详细介绍了如何使用Transformers框架进行大型语言模型(LLM)的训练,包括预训练、有监督微调和高效微调。预训练部分讲解了使用Transformers框架和分布式框架deepspeed进行模型预训练的全过程,包括模型初始化、数据预处理和使用Trainer进行训练。有监督微调部分则介绍了如...
本文是《从零开始的大语言模型原理与实践教程》的第五章,介绍了如何动手搭建大模型LLaMA2。首先,定义了模型的超参数,包括模型大小、层数、头数等,并创建了ModelConfig类。接着,详细讲解了如何构建RMSNorm、LLaMA2 Attention和MLP模块,以及如何将这些模块组合成一个完整的...
本文详细介绍了大语言模型(LLM)的概念、特点、能力以及训练过程。LLM是参数量更多、在更大规模语料上进行预训练的语言模型,具有涌现能力、上下文学习能力、指令遵循能力和逐步推理能力。训练LLM需要经过预训练(Pretrain)、有监督微调(SFT)和人类反馈强化学习(RLHF)三个阶段。预训练使用海...
DeepSeek-R1是一款适合个人和企业部署的AI大模型,提供了不同参数的子模型以满足不同需求。个人部署可以通过Ollama框架在本地机器上轻松运行,而企业部署则可以根据自身业务需求选择合适的模型。本文详细介绍了个人和企业部署DeepSeek-R1的方法和步骤,包括模型选择、框架安装、模型下载和运...
DeepSeek实用集成是一个项目,旨在帮助用户轻松地将DeepSeek大模型能力接入各类软件。项目提供了多种应用程序、AI Agent框架、RAG框架、即时通讯插件、浏览器插件、VS Code插件、neovim插件、JetBrains插件等,以实现DeepSeek的集成。用户可以访问DeepSee...
OpenAI GPT-4的不同版本包括gpt-4o系列(轻量和标准版,优化模型体积和速度),gpt-4-turbo系列(加速版,快速响应),以及gpt-4系列(完整版,高准确度)。预览版用于测试新功能。这些版本在性能、速度和资源消耗上有所不同,价格也有所差异,GPT-4o系列价格较低,GPT-4 T...
随着AI大模型开发浪潮的兴起,中国科技公司、学术研究机构和高校纷纷发布了自己的大模型产品,开启了“百模大战”时代。这些模型涵盖了金融、科技、电商、医疗、法律等多个行业,部分模型如清华大学的ChatGLM-6B、智源人工智能研究院的悟道·天鹰等为开源项目,允许商业化,方便企业和个人开发者打造自己的生成...