Please turn JavaScript on

Software 2.1

We bring you the latest updates from Software 2.1 through a simple and fast subscription.

We can deliver your news in your inbox, on your phone or you can read them here on this website on your personal news page.

Unsubscribe at any time without hassle.

Software 2.1's title: 汇智网 - 前沿的在线互动编程学习平台

Is this your feed? Claim it!

Publisher:  Unclaimed!
Message frequency:  8.94 / day

Message History

TurboOCR 是 aiptimizer 团队的 C++20/CUDA/TensorRT 服务器,封装了与 PaddleOCR 相同的 PP-OCRv5 模型,声称在 FUNSD 表单上达到每秒 268 张图片。我们在 OmniDocBench 设置上运行它,测量到在基准测试的前 500 页英文页面上达到每秒 28 页。

比我们测试过的最快 VLM LightOnOCR 快五十三倍。在原始吞吐量上完胜。

关键问题是:达到每秒 28 页大约需要在全新机器上设置 90 分钟。它还在表格结构上得分为零。让我们来分析为什么、如何以及何时它才是真正正确的工具。

1、TurboOCR 到底是什么

它不是库。不是 Python 包。它是一个生产级 OCR 服务器,你作为 Docker 容器部署,通过 HT...


Read full story

我们把 UX 设计当作一种神圣的、不可穿透的艺术形式。实际上,大多数数字产品设计只是组件操作,而 Anthropic 刚刚把它商品化了。

如果你本周浏览了 设计 论坛,你会发现情绪已经从轻微不满转变为彻底的生存恐惧。

Anthropic 发布了 Claude Design,由他们新的 Opus 4.7 视觉 👁️ 模型驱动。

你可以给它一个品牌风格指南或你现有应用的几张截图,它就能通过聊天界面生成完全可交互的线框图、演示文稿和用户流程。它甚至可以直接导出到 Canva,或者将代码规范直接交给 Claude Code CLI 进行即时实现。

但是,这个功能是预料之中的,对吧?迟早的事。

然而,设计社...


Read full story

两个工程师,同一家公司。一个什么都用 AI,另一个拒绝碰它。

上个月两人都被裁了。

我一直在关注整个行业的情况(很多好朋友受到了影响)。我一直看到同样的事情——这完全是由 AI 引起的。

你仍然应该担心你的工作。

不是因为 AI 已经取代了软件工程师。任何告诉你这一点的人都在向你推销蛇油。

有另一件不好的事情正在发生。一件大多数人忘记的事情。这适用于大型、中型和小型公司。

我不是来让你对这感觉好受些的。

1、你参与的辩论是错误的

互联网现在完全分裂了。

一方说: <...


Read full story

审查法律合同和商业文档——根据手册、指南和合规标准标记偏差、提出和应用更改,确保每项条款经得起检验——是繁琐、耗时且容易出错的任务。

我们在芬兰 AI 区域 (FAIR) 项目中的 AI 咨询经验表明,对 AI 辅助文档审查的需求正在增长。AI 辅助文档审查的一些例子包括根据组织手册进行合同审查、监管和 ESG 合规检查,以及 RFP 响应验证。

使用 AI 进行文档审查的理想工作流程是扫描 → 标记 → 建议 → 修复,AI 扫描文档,标记问题,提出修复建议,让用户决定哪些修复需要执行,然后应用修复。

大型语言模型 (LLM) 在这方面具有巨大潜力。然而,要应用上述工作流程,...


Read full story

我们的 agent 请求一个产品价格,却收到了 50,000 个 token 的 HTML,而实际需要提取的内容只有 200 个 token。Scrapling 的 MCP 服务器在服务端提取内容,其自适应解析器在网站更改标记时仍能继续工作。

这是大多数 agent 构建者直到账单到来时才会注意到的一个条目。每次我们的 agent 获取网页时,我们都在以前沿模型的价格来解析 HTML。

页面有 50,000 个 token。我们想要的内容只有 200 个。模型做了 99% 的苦力活来获取我们要求的 1%。

将这个数字乘以每个用户的每一天中每个推理循环中的每次工具调用,就变成了真正的钱,而且这完全是可避免的。

修复方法事后看来很明显:在模型看到内容之前先提取内容。传递结构化数据,而不是标记...

Read full story