当前位置:编程学习 > C#/ASP.NET >>

应用OFFICE的OCR控件MODI,怎么使识别出来的文本保留格式

我用MODI识别图像文件,识别出来的文本都是一个挨着一个的,不含有原来的格式 怎么改进下能使其还有原来的格式
这是我用的代码:
private string Recognition(string strFileName)
        {
            string strResult = string.Empty;

            // 宣告 MODI.Document 物件 modiDocument,并且实例化 
            MODI.Document modiDocument = new MODI.Document();

            // MODI.Document 创建
            modiDocument.Create(strFileName);

            // 宣告 MODI.Image 物件 modiImage,其內容值来自 MODI.Document 物件 modiDocument  
            MODI.Image modiImage = (MODI.Image)modiDocument.Images[0];

            // OCR Method(Language, WithAutoRotation, WithStraightenImage)  
            modiImage.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, false, false);

            // 組合 OCR 识别后的 Word  
            foreach (MODI.Word WordItem in modiImage.Layout.Words)
            {
                strResult += WordItem.Text;
            }
            modiDocument.Close(false);

            // 回传识别结果  
            return strResult;
        } --------------------编程问答-------------------- 保留格式不可能的, --------------------编程问答-------------------- 使用OneNote 2010的组件来进行OCR识别吧 --------------------编程问答-------------------- 使用OneNote2010的组件来做OCR识别吧 --------------------编程问答-------------------- 使用OneNote2010的组件来做OCR识别吧,效果比较理想。 --------------------编程问答--------------------
引用 1 楼 net_lover 的回复:
保留格式不可能的,

+1 --------------------编程问答-------------------- 可以通过IWord的接口,跟踪每个字的坐标变化,进行换行,管用的。 --------------------编程问答-------------------- 根据横坐标变化,可以嵌入空格。
补充:.NET技术 ,  C#
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,