科技让文物“活”起来
保护历史文化遗产就是记录和传承文明发展史
基于OCR技术的古籍数字化是保护文化遗产最佳措施之一
鹑火对各种婆罗米系文字、中国少数民族文字的人工智能OCR技术世界领先
鹑火使命
我们一直致力于“用科技及创新来传承和传播文化”
利用计算机视觉、神经网络和机器学习等AI技术,推动多种语言文字数字人文建设
行业领先
-
全球首家柬埔寨高棉文识别
高棉文是东南亚最古老最复杂的文字,鹑火与北京外国语大学深度合作,在全球首先实现高棉文OCR
-
全球首家梵音藏文、藏文缩写合成字识别
支持GB/T标准字符集、扩充集A、扩充集B三种标准收录的全部单字,额外支持了梵音藏文各种多层堆叠字和藏文缩写合成字
-
全球首家藏文草体字识别
基于66种藏文字体训练,支持楷书、草书、行书字体:乌金体、白徂体、朱匝体、徂仁体、徂同体、徂玛遒体等藏文字体。基于42种高棉文字体训练,支持Khmer OS、Moul、Metal Chrieng等高棉文字体
-
多种书籍版式识别
支持多种书籍版式的高精度识别,包括各种贝叶经、木刻版和手写本古籍(包括梵箧装、缝缋装、经折装、蝴蝶装、卷轴装等版式)及各种现代书籍。支持文字字体颜色识别和页眉页脚识别。支持页面倾斜校正、多合一排版自动拆页
-
全球领先的数字
图书馆系统提供视觉还原数字图书阅览器,支持全库书籍信息检索及内容全文搜索,多版本自动对勘,多种拉丁转写系统,智能校对系统,海量词库(超过四十万个藏文词汇和一万个藏文音节),智能分词系统,在线翻译系统
核心技术
-
全球领先的多语言文字AI OCR引擎
基于计算机视觉、神经网络、机器学习等AI核心技术,针对各种语言文字做高精度的OCR,包括中文、拉丁字母文字、婆罗米系文字(藏文、高棉文等),婆罗米系文字OCR技术已获得发明专利,专利号:ZL202210262353.3。
-
强大丰富的OCR技术实现
支持客户端识别和服务端识别,提供Server、SDK和命令行工具,支持Windows、Linux、Mac OS,支持CPU计算和GPU计算,基于36层神经网络,识别速度高达每页1秒,版式清晰、字体标准的书籍识别率接近100%
-
全球领先的多层堆叠单字智能拆合字技术
基于对藏文、高棉文的深度研究,通过将多层堆栈单字的所有组成部件进行智能拆分和独立识别,将其Unicode编码进行重组和合并得到单字完整编码,最终实现OCR支持所有藏文和高棉文的复杂单字
-
国内外证件OCR及
MRZ识别基于计算机视觉技术和MRZ规则智能分析,支持多国身份证件OCR及MRZ识别、支持多国护照OCR及MRZ识别、多国驾照OCR识别
-
计算机视觉技术
深度应用基于计算机视觉、神经网络和机器学习等AI技术实现的车牌识别、车辆照片的品牌型号识别、人脸识别、交通信号灯识别、交通指示牌识别、道路标识识别