人机协作

搜索文档
智能交互终于步入真·人机交互时代了,这很讯飞
量子位· 2025-06-13 05:07
核心观点 - 智能硬件交互从基础指令式升级为深度智能协作,实现拟人化自然对话和多场景赋能 [5][9][12] - 科大讯飞通过AIUI平台和机器人超脑平台技术突破,推动人机交互向情感化、记忆化、快速响应方向演进 [14][21][23][25] - 儿童场景成为大模型时代交互最高频领域,交互频次增长733%,公司针对性推出童言识别模型和场景化学习方案 [26][28][66] - 多模态交互技术显著提升机器人环境适应性,语音识别率从83%提升至96%,并实现1.6秒端到端响应 [40][41][42] - 智能语音背包创新方案解决存量机器人语音交互痛点,即插即用赋能500+机器人客户 [49][51][57] 技术升级 - AIUI平台累计服务超10亿设备,新增全双工交互模式和情绪感知能力,支持对话节奏自适应与语调情绪识别 [15][19][20] - 星火交互大模型通过千万级高情商对话数据训练,实现共情能力升级 [21] - 类人记忆系统采用长短时记忆融合架构,构建用户画像和知识库,形成个性化交互 [23] - 机器人超脑平台整合视听融合感知技术,将拾音角度从60°压缩至30°,显著抑制环境噪声 [39][40] 场景落地 - 智能眼镜采用三麦阵列降噪技术,实现嘈杂环境中的一对一私密对话 [30] - 人形机器人集成多模态交互,具备主动迎宾、专业问答等功能,应用于4S店等真实场景 [44][45] - 数字人交互平台构建超10万分身,年制作量提升16%,日交互次数增长6.5倍,多领域市占率第一 [61][62] - 开发者生态联合30万+开发者共建解决方案,大赛覆盖108道赛题推动技术转化 [31][69] 行业趋势 - 语音交互从单向指令转向共同目标完成,实现"能共事"甚至"替你想"的协作层级 [74][76] - 机器人服务能力进化将逐步替代遥控器、屏幕等中间介质,直接交互成为刚需 [59] - 技术-场景-生态闭环加速产业升级,覆盖广电、医疗、办公等核心痛点领域 [75][68]
智能交互终于步入真·人机交互时代了,这很讯飞
量子位· 2025-06-13 05:07
核心观点 - 智能硬件交互正从基础指令式升级为深度智能协作,实现"万物皆可交互"的愿景 [5][9][12] - 科大讯飞通过AIUI平台和机器人超脑平台技术突破,推动人机交互向拟人化、多模态、场景化方向发展 [10][34][36] - 儿童场景成为大模型时代交互需求增长最快的领域,交互频次飙升733% [26][66] 技术突破 AIUI交互平台升级 - 全双工交互模式实现"有所闻有所不闻",能识别用户迟疑、附和等非结构化语音输入 [17][19] - 情绪识别技术通过语调分析判断用户情绪状态,基于千万级高情商对话数据训练共情模型 [20][21] - 类人记忆系统采用长短时记忆融合架构,构建用户专属知识库和聊天方式 [23] - 音频端到端响应时间缩短至1.6秒,量产语音交互系统中处于领先水平 [25] 机器人超脑平台 - 整合视听融合感知(语音+唇形+人脸追踪)、多模态降噪技术,嘈杂环境下语音识别率从83%提升至96% [39][40][41] - 模块化设计解决行业碎片化需求,已应用于500+机器人客户,覆盖人形/四足/轮式机器人 [46][47][57] - 智能语音背包实现即插即用,为存量机器人赋予对话能力,现场演示中实现拟人化幽默互动 [49][51][55] 场景应用 儿童交互方案 - 专设童言识别模型和童语理解模型,应对儿童天马行空的非结构化表达 [26] - 结合AI早教实现场景化学习,如引导儿童用英语描述恐龙特征等趣味互动 [28] - 儿童场景交互速度增长7倍,成为大模型时代最高频交互场景 [66] 多硬件赋能 - 智能眼镜采用三麦阵列降噪技术,嘈杂环境中实现一对一私密对话 [30] - 数字人平台构建超10万分身,2024年制作量提升16%,日交互次数增长6.5倍 [61][62] - 轻量化方案支持一句话+照片快速生成数字人分身,覆盖教育/金融/媒体等领域 [63] 生态布局 - AIUI联合30万+开发者共建解决方案,推动软硬件交互效果优化 [31] - 开发者大赛设36道应用赛+72道算法赛,涵盖智能座舱/多模态虚拟人等前沿赛道 [69] - 技术-场景-生态闭环已赋能广电/家庭/医疗/办公等场景,实现产业级落地 [75][76]
微软要做的智能体网络是什么
钛媒体APP· 2025-06-10 04:09
微软智能体战略布局 - 微软CEO萨提亚提出开放智能体网络(Open Agentic Web),构建全新人机协作范式 [2] - 84%中国市场领导者认为2025年是重新思考核心战略的关键年,57%已使用智能体自动化团队/部门工作流程 [2] - 财富500强企业中70%采用微软智能体解决方案 [6] - 微软定位为"能力转化平台",通过Copilot Studio低代码平台和Azure AI Foundry(支持1900+模型)构建开放生态 [4] 技术协议架构 - 智能体网络基于MCP协议(实现数据-模型垂直整合)和A2A协议(实现跨智能体任务分配) [3][4] - MCP协议由Anthropic2024年提出,A2A协议由谷歌2025年4月提出 [3][4] - 微软大中华区首席运营官预测未来将实现亿级智能体互联 [4] 行业竞争格局 - OpenAI以GPT系列模型为基础注重通用性创新 [4] - 谷歌将智能体融入搜索/云计算场景,覆盖电商/金融/医疗等行业 [4] - Meta侧重社交领域应用(如Messenger聊天机器人、Horizon Worlds虚拟角色) [4] - 微软通过开源协议构建开放生态系统,强调企业级安全合规(禁用训练数据采集、生成内容版权保护) [5] 应用场景与成效 - 微软CSS客服应用智能体后效率提升31% [7] - HR入职流程引入智能体后效率提升10倍 [7] - 某汽车零件制造商运用工厂运营智能体实现生产线异常实时分析 [9] - 香港大学使用智能体自动解答新生问题(课程/奖学金/实习等) [10] 发展阶段与趋势 - 1.0阶段:Copilot作为辅助工具(如文档生成) [10] - 2.0阶段:智能体成为"数字同事"执行特定任务 [10] - 3.0阶段:智能体自主运行业务流程,员工转为管理者 [10] - 中国企业智能体应用呈现交互模态多元化/模型选择多样化/应用层级跃迁三大趋势 [9]
刚刚,新一届ACM博士论文奖正式公布
机器之心· 2025-06-05 07:14
ACM博士论文奖 - 2024年ACM博士论文奖授予Ashish Sharma,其研究聚焦人机协作改善心理健康支持的可及性和质量[3][4] - 获奖论文开发了AI辅助心理健康工具,已拥有超16万用户,其中50%以上家庭年收入低于4万美元[5] - 研究包含三大创新方向:通过强化学习训练志愿者提升共情能力、优化自助工具用户体验、建立AI心理咨询质量监督框架[8][10] 人机协作心理健康系统 - 基于Reddit/TalkLife平台数据开发AI反馈系统,经300名志愿者测试证明可显著提升共情表达效果[8][10] - 在15,531人参与的随机试验中,人机协作系统成功帮助用户克服消极思维模式[10] - 分析13种心理治疗技术发现,当前LLM行为模式更接近低质量人类治疗师,常违反治疗准则提供直接建议[11] 计算模型局限性研究 - 荣誉提名论文研究伪随机分布对低复杂度计算模型的限制,涉及分支程序/常数深度电路等模型[15][17] - 该研究为破解P与NP等理论难题提供新路径,在密码学领域具有应用潜力[15] - 论文作者Alexander Kelley系统构建了面向特定计算模型的稳健性限制理论框架[16] 大型语言模型数据利用 - 荣誉提名论文揭示LLM的上下文学习能力主要依赖训练数据记忆,提出非参数语言模型新架构[19][21] - 开发神经检索模型实现训练数据的动态复用,提升模型准确性和可更新性[22] - 探索数据使用伦理框架,包括区分版权文本与许可文本的差异化处理方法[23]
药师帮(09885) - 自愿性公告 订立战略合作与业务部署协议
2025-06-03 09:30
市场展望 - 预计2028年全球医疗健康领域协作机器人市场规模达3.732亿美元[5] 战略合作 - 2025年6月3日药师帮与越疆科技订立合作协议[3] - 双方以医药协作机器人等为核心开展合作[6] - 初始阶段先于药店、药仓协作机器人领域合作[7] 项目进展 - 双方确定首个落地项目,开始搭建测试平台[7] - 越疆科技独家生产,药师帮独家销售项目机器人[7]
重新理解Agent的边界与潜力:AI转型访谈录
36氪· 2025-05-29 10:53
行业趋势 - 2025年被业界称为"Agent元年",各类AI Agent产品快速涌现,但市场尚未形成统一定义[1] - AI Native公司正突破传统框架,探索Agent在商业洞察、创意生成、组织变革等领域的深层价值[1] - 大语言模型使模拟研究从群体行为转向个体层面,催生"生成式社会科学"新兴学科[13][15] 产品创新 - Atypica.ai通过大语言模型模拟真实用户行为,构建典型用户画像(Persona),解决无标准答案的商业问题[3][4] - 采用多智能体协同工作模式:一个Agent扮演专家采访其他模拟用户,实现高效低成本的大规模用户访谈[6][18] - 独创发散优先模型,允许AI生成非共识观点,适用于需要多元视角的商业问题[5][24] - 工作流程分三步:明确商业问题→生成典型用户画像→多Agent访谈并生成图文报告[17][18] 应用场景 - 解决四大商业问题:市场洞察(如新能源汽车需求分析)、产品共创、产品测试(如巧克力配方选择)、内容规划[19] - 支持跨语言商业分析,如外国企业直接获取中国社交媒体数据并生成本土化报告[20] - 与权威媒体合作整合严谨数据源,平衡社交媒体多元观点与事实准确性[22][23] 技术特点 - 基于大语言模型激发特定个性特征,通过Context控制模拟深度(从简短发帖到长篇访谈)[31] - 采用预设题库+动态提问机制,使问题更贴合用户需求[35] - 保留AI"幻觉"的积极价值,拓宽思维边界,特别适合民意调查等非共识场景[24][27] 组织变革 - AI推动工作方式从专业化分工转向复合型人才,公司架构向更少岗位、更多技能方向发展[40][41] - 开发周期从两周迭代缩短至单日多次迭代,小团队(2-3人)可独立负责端到端项目[43] - 企业需平衡数据安全、私有数据整合、深度分析、结果转化等需求[38] 产品战略 - 避免"老瓶装新酒"模式,主张"新瓶装新酒"(全新AI产品)或"新瓶装旧酒"(AI重构交互)[48][49] - 重点打造账号个性化(Personality),基于企业数据源进行内容再创造而非简单改编[53] - 开发反对型AI交互,突破大模型过度驯服的问题,增加观点多样性[56][58] 未来展望 - 多智能体交互可暴露人类决策盲区,辅助管理者获得新视角[59][60] - 虚拟Agent可能成为观察人类社会的"镜像",其形态发展尚难预测但潜力巨大[5][59] - 行业需探索基于AI能力重新设计工作流程,而非简单叠加Copilot功能[52][53]
外骨骼机器人:从医疗康复走向大众消费的新蓝海
Wind万得· 2025-05-23 22:41
外骨骼机器人特点 - 外骨骼机器人是一种结合外骨骼结构和机器人技术的可穿戴智能设备,通过与人体运动系统协同工作增强或恢复运动能力,本质是人机协作系统 [4] - 主要特点包括:人机交互与协同(通过传感器实时感知人体运动意图并预测动作)、轻量化与舒适性(采用碳纤维/钛合金等材料)、智能化与自适应性(AI算法学习用户习惯动态调整辅助策略) [4][5] - 按适用部位可分为上肢/下肢/腰部/全身外骨骼机器人,按应用场景可分为康复型/工业用/军用/消费型等 [5] 应用现状 医疗领域 - 帮助偏瘫/截瘫/脑卒中患者康复训练,北京协和医院数据显示康复效率提升70%,肌肉萎缩风险下降50% [12] - 大艾机器人AiWalker、傅利叶智能ArmMotus系列已获医疗器械注册证,伟思医疗下肢外骨骼进入18省医保覆盖300+三甲医院 [10][12] - 国内65岁人口超2亿,2030年将破3亿,政策推动下需求持续增长(纳入"十四五"规划及医保支付) [12] 工业领域 - 铁甲钢拳CEXO系列与京东物流合作,搬运15-25kg箱体使工人连续作业时间从4小时延长至6小时,分拣效率提升60% [13] - 福特工厂引入EksoVest外骨骼使工人肩部负荷降低80%,生产效率提升15% [13] 军事与消费领域 - 傲鲨智能外骨骼助消防员携带50kg装备攀登30层楼,美国TALOS外骨骼负重能力达100kg [14] - 消费级产品如程天科技易行EasyGo售价2599元上线15秒售罄,泰山景区投放500台外骨骼节省30%-50%体力 [14] 市场空间 - 2024年全球市场规模约17.6亿美元,预计2032年达305.6亿美元(CAGR 43.1%),北美占40%份额,亚太增速最快(CAGR 26.4%) [15] - 增长驱动因素:技术进步(材料/AI算法)、老龄化需求(国内65岁人口2030年破3亿)、成本下降(消费级产品低至数千元)、政策支持(康复辅助器具产业政策) [15] 投融动态 - 2024年以来国内外融资超10起,总金额近10亿元,傅利叶智能E轮融资近8亿元,程天科技B轮融资近1亿元 [19][20] - 投资方包括张江科投/浦东资本等国资机构及红杉中国/经纬创投等市场化基金,显示政策与资本双重关注 [19][20]
外骨骼机器人:从医疗康复走向大众消费的新蓝海
来觅研究院· 2025-05-23 12:13
报告行业投资评级 未提及 报告的核心观点 外骨骼机器人应用场景不断拓宽,市场规模有望扩大,但面临技术、成本、市场等挑战,未来融资活动预计保持活跃 [3][13][14][17] 根据相关目录分别进行总结 外骨骼机器人特点 - 外骨骼机器人是结合外骨骼结构和机器人技术的可穿戴智能设备,本质是人机协作系统,特点包括人机交互与协同、轻量化与舒适性、智能化与自适应性 [4] - 按适用部位可分为上肢、下肢、腰部、全身外骨骼机器人;按应用场景可分为康复型、工业用、军用、消费型外骨骼机器人 [4] - 外骨骼机器人研究可追溯到1960年前后,早期用于军事,2000年前后进入医疗康复领域,2024年以来走向消费级市场 [6] 外骨骼机器人应用现状 - 医疗领域:是重要康复工具,可提升康复治疗效率和质量,市场需求增长,政策支持加速行业成长,部分企业产品已广泛应用并获认证 [9][10] - 工业领域:可提升工人工作效率,减轻疲劳,降低工伤概率,需求仍在增长,预计渗透率将继续提升 [11] - 军事领域:可增强士兵体能、作战和生存能力 [11] - 消费领域:在户外休闲领域处于起步阶段,但潜力大,部分产品已在景区使用,消费级市场需求开始释放 [12] 外骨骼机器人市场空间 - 2024年全球市场规模约17.6亿美元,预计2032年达305.6亿美元,2025 - 2032年年复合增长率约43.1%,亚太地区增长最快 [13] - 市场规模增长原因包括技术进步、社会需求增加、成本降低、政策支持 [13] - 面临技术续航和智能化不足、成本高、市场难以满足用户需求和认证周期长等挑战 [14] 外骨骼机器人投融动态 - 近两年来融资热度持续提升,2024年以来融资案例超10起,合计融资金额近10亿元 [15] - 投资方包括国资背景企业和各类投资机构,预计未来融资活动将继续活跃 [17]
AI时代如何分好“蛋糕”:组织内薪酬分配挑战与优化
虎嗅· 2025-05-18 12:40
人-AI协作下的薪酬分配挑战 - AI技术通过人机协作显著提升生产力和组织效率,例如金融领域智能机器人处理常规问题、制造业协作机器人承担重复性任务[1] - 好莱坞2023年7月全行业罢工事件显示AI引入导致垂直薪酬差距扩大,员工抵制可能阻碍技术推广[2] - 麦肯锡2024年报告指出生成式AI使知识生产类岗位自动化率从25%升至59%,远高于人际社交类岗位,加剧水平薪酬差距[2] - 同岗位内AI使用差异导致薪酬分化,如年轻医生借助AI提升诊断效率,年长医生适应速度慢导致绩效落后[2] 薪酬分配不均的根源 - 绩效归属模糊性:Access Holdings Plc案例显示AI使代码编写时间从8小时缩短至2小时,但员工可能因提效被质疑"走捷径"[5] - 中国上市公司数据显示AI引入后管理者薪酬显著增长而员工薪酬停滞,利润分配向管理层倾斜[7] - AI使用机会不均:生成式AI对专业岗位增强效应显著,但强社交岗位(如并购专家)替代率低[8] - 年长员工因感知易用性低、信任度不足导致AI接受度仅为年轻员工的1/3[8][9] 解决方案框架 - 薪酬包机制设计:总薪酬=(预期绩效+AI预期绩效)×(历史薪酬/存量绩效)+AI绩效×共享系数,解决收益分配问题[21][25] - 360度评估新增"AI使用"、"AI贡献"、"基于AI的创新"指标,量化员工AI应用价值[26] - 战略性薪酬包补偿早期探索者沉没成本,如三星工人罢工案例显示补偿机制缺失的后果[25] - 知识共享体系包含企业培训(系统性技能提升)和员工间经验交流(任务协同增效)[18][19] 行业实践启示 - 金融业通过智能客服分层处理问题,制造业用协作机器人优化流程,显示AI增强而非替代人力[1] - 好莱坞罢工和韩国三星事件警示未合理分配AI收益将导致双输局面[21] - 医疗行业年轻医生AI应用效率比传统方法高3倍,但需平衡技术代际差异[2][8] - 供应链领域AI预测使信用评级准确率提升40%,工业AI实现全流程智能管理[8]
中金 | 大模型系列(3):主动投研LLM应用手册
中金点睛· 2025-05-15 23:32
核心观点 - 大语言模型(LLM)在主动投资领域具有变革性潜力,能够解决信息过载问题,提升投研效率和深度 [1][8] - LLM在信息获取与处理、深度分析与挖掘、策略生成与验证三个核心环节展现出强大应用价值 [3][4][5] - 人机协作是LLM在主动投资领域最现实且最具价值的应用模式,需要投研人员掌握Prompt Engineering等新技能 [9][10] 信息获取与处理 - LLM能够自动化市场信息跟踪,实时抓取多源数据并生成结构化摘要,提升信息处理效率 [3][13] - 在分析师报告聚合与对比方面,LLM可自动解析不同格式研报,提取关键信息并识别市场共识与分歧点 [3][29][30] - 对于上市公司业绩电话会纪要,LLM能快速处理会议内容,提取财务更新、战略重点等关键信息 [3][31][32] 深度分析与挖掘 - LLM能够量化文本情绪,识别细微情感变化,并绘制情绪变化曲线,为投资决策提供独特视角 [4][38] - 在组合分析与风险识别方面,LLM可提供基于实时事件和非结构化信息的风险分析,增强风险管理前瞻性 [4][39] - LLM能够分析组合持仓相关的重大新闻、行业动态等文本信息,为传统量化归因模型提供补充解释 [4] 策略生成与验证 - LLM在基本面因子挖掘方面具有思路广度、逻辑自洽和高度可定制化三大优势 [5][45] - LLM能显著降低策略回测门槛,将自然语言描述的投资策略自动转化为可执行代码 [5][46] - 通过自然语言到代码的转换,LLM加速了投资方法的验证与优化过程 [5] 应用前景 - LLM适合执行大规模数据处理和初步分析,而人类在目标设定、逻辑构建等方面具有优势 [6] - 构建高效的人机协作模式是LLM大规模成功应用的前提 [6] - 投研人员需要发展Prompt Engineering等新能力来充分利用LLM的潜力 [9][10]