谷歌开源Magika:AI驱动文件类型识别系统,提升用户安全
划重点:
🔍 AI技术:Magika使用自定义深度学习模型,毫秒级内准确识别100 文件类型。
🛡️ 提升安全:在Google内部应用于Gmail、Drive和安全浏览,强化文件安全检查和内容策略扫描。
🔄 开源易用:支持多种文件类型、高效性能,即将与VirusTotal集成,GitHub提供代码和模型。
Google最近开源了一款名为Magika的文件类型识别系统,该系统由AI驱动,能够在毫秒级内准确识别超过100种不同的文件类型,包括二进制文件和文本文件。在Google内部,Magika被广泛应用于提升用户安全,主要用于对Gmail、Drive和安全浏览中的文件进行适当的安全检查和内容策略扫描。
Magika的主要功能特点包括:
AI驱动的准确识别:Magika采用了自定义的、高度优化的深度学习模型,使其能够在几毫秒内准确识别出二进制和文本文件的类型,即便是在CPU上运行也能快速完成。
支持多种文件类型:它能够识别超过100种不同的文件类型,包括常见的文档、图片、代码文件和配置文件等。
高效性能:在包含100万文件的基准测试中,Magika的识别性能比其他现有工具高出约20%,尤其在处理文本文件时,展现出更大的性能优势。
此外,Magika的广泛应用不仅体现在提高用户安全方面,还包括简单易用的安装和使用。用户可以通过简单的命令行指令pip install magika进行安装,而且无需GPU支持。该系统的代码和模型在GitHub上免费提供,并且采用Apache2许可证,便于其他软件改进其文件识别准确性,为研究人员提供大规模识别文件类型的可靠方法。
Magika即将与VirusTotal集成,这将提高平台分析和检测恶意代码的效率和准确性,有助于全球网络安全生态系统的建设。总体而言,Magika的开源和易于集成特性使其成为一个备受期待的文件类型识别工具,有望为文件安全领域带来新的发展。详细介绍和演示可以在其网站和GitHub页面上找到。
项目入口:https://top.aibase.com/tool/magika
- 0000
- 0000
- 0000
- 0000
- 0000