HyperAI超神经
Back to Headlines

氛围编码:AI辅助开发的新范式与挑战

11 小时前

“ vibecoding ”这一概念自2023年被OpenAI的工程师Andrej Karpathy提出后,在开发者社区引发了广泛的讨论和尝试。vibecoding的核心在于通过自然语言指令引导AI生成代码,与现有的AI辅助编程不同,后者主要集中在代码补全、错误检测等方面。Karpathy设想的未来是让开发人员能够用自然语言驱动开发过程,减少直接编写代码的负担。 然而,许多开发者在尝试vibecoding的过程中遇到了挫折,认为它并不如预期般高效或实用。有的批评意见指出,vibecoding更适合不具备技术背景的用户。在概念推出几周后,Karpathy本人也坦率地分享了他在实践中遇到的问题,尽管如此,AI作为工具对提高开发者生产力的潜力仍被普遍认可。这种潜力促使Shopify这样的大公司采取行动,其首席执行官Tobi Lutke要求员工在申请扩充团队前,需要证明AI无法完成的工作,这反映了行业对AI辅助开发的关注和期待。 为了探索vibecoding的实际效果,一名开发者直接与多个大型语言模型(LLM)进行了交互测试,这些模型包括ChatGPT、Gemini2.5Pro、ClaudeSonnet、DeepSeek、Qwen3及Mercury。实验任务是要求各模型“用Python构建一个医生预约网站”。测试结果显示: ChatGPT提供了基于Flask框架的整个基本应用程序实现,包括业务逻辑和技术设计说明。但设计较为基础。 Gemini 2.5 Pro展现了更为系统性的方法,先对比Django、Flask和FastAPI的不同特性,再基于这些分析选择最合适的解决方案。强调了诸如数据库索引和缓存策略等内容以增强应用的可扩展性。 Claude给出了与ChatGPT相似的基础项目结构,但所有HTML内容都被嵌入了一个文件中,对现实应用中的可用性构成了挑战。 DeepSeek不仅生成了干净的Python和HTML代码,还包含了一个需求文件、数据库设置流程以及更有序的项目组织方式,这些都令其方案看起来更为成熟可应用。 Mercury则侧重教育性质的内容,逐步指导用户完成从环境搭建到功能实现的全过程,虽然代码的规模不大,但是非常适合初学者。 Qwen3的输出尤其重视企业级应用的要求,比如支付集成的可能性、部署方案的选择以及安全性考量。它还特别强调了代码结构化、逐步验证的重要性。 尽管某些知名LLM没有显示出比较少使用的模型更加出色的能力,测试结果揭示了几个重要的发现: 代码质量相对较高,符合大多数编程规范,且具有较强的自纠错能力。 忽略外部配置需求,未能充分考虑目标环境、基础设施选型等问题。 缺乏有效互动,无法根据用户的反馈进行调整或澄清需求细节。 忽略软件生命周期管理,直接进入编码阶段而非先进行规划。 个性化处理影响协作,即每个LLM都有自己的风格,这对团队间的协同工作造成了困扰。 项目结构理解不够深入,LLM未能全面掌握项目的架构设计和商业背景。 知识更新滞后,LLM通常具有固定的截止日期前的知识库,可能导致所用技术版本过时。 针对现有的几款专门支持vibecoding的IDE如Cursor、WindSurf和Trae,同样存在上述部分问题,它们虽然优化了人机交互界面,但在处理复杂的开发任务时仍然表现出明显的限制性和不稳定性。 要充分利用vibecoding的优势,开发者需要转变思维方式,成为项目的“产品经理”,而不是单纯的程序员。这意味着更加注重前期的需求分析、架构规划等工作,教会AI如何理解和遵循团队规则和标准,并保持对AI生成代码的严格检查和版本控制。AI应当被视为快速学习的新同事,而不是完美的解决方案提供者。通过这种方式,开发者可以更好地适应未来以AI为核心的开发模式,享受技术带来的便利的同时也能克服当前面临的技术障碍。 业内普遍认为,虽然vibecoding尚处在早期发展阶段,但其长期潜力不容忽视。Shopify等公司的积极态度表明,企业在探索人工智能助力开发效率方面投入了大量努力,这也促使更多的研究和实践投入到该领域。OpenAI作为一个在人工智能研究领域极具影响力的公司,Karpathy提出的这一概念无疑将继续影响未来的软件开发趋势。

Related Links