当前位置:编程学习 > C#/ASP.NET >>

tessnet2.Tesseract ocr 耗尽内存

        private void btnGo_Click(object sender, EventArgs e)
        {
            tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
            string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
            if (!string.IsNullOrEmpty(txtCharList.Text))
            {
                defaultCharList = txtCharList.Text;
            }
            ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
            ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); //应用当前语言包。注,Tessnet2是支持多国语的。语言包下载链接:http://code.google.com/p/tesseract-ocr/downloads/list

            WebClient wc = new WebClient();
            byte[] oimg = wc.DownloadData(txtImageUrl.Text); // 自己修改成要识别的地址吧
            Bitmap bp = new Bitmap(new MemoryStream(oimg), true);//识别图像
            Bitmap bp2 = new Bitmap(new MemoryStream(oimg), true);
            picBox1.Image = bp2;
 
            picBox2.Image = bp;

            List<tessnet2.Word> result = new List<tessnet2.Word>();
            string txt = "";

            try
            {
                result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
                foreach (tessnet2.Word word in result)//遍历识别结果。
                {
                    txt += word.Text;
                }
            }
            catch (Exception ex)
            {

            }
 wc.close();
bp.dispose();
bp2.dispose();
wc.close();
ocr.dispose();

  GC.Collect();
            GC.WaitForPendingFinalizers();
  GC.Collect();
            textBox1.Text = txt;
        }
           
从网上下载了OCR.Tesseract.Demo1,测试时发现,这段代码每次都消耗内存, 重复多次使用后,把内存消耗完了。

最主要是下面几步:
 tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
            string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
            if (!string.IsNullOrEmpty(txtCharList.Text))
            {
                defaultCharList = txtCharList.Text;
            }
            ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
            ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); 
特别耗内存。

大家有没有好的解决办法? --------------------编程问答-------------------- 还没看明白 --------------------编程问答-------------------- 上面这段代如果放在while中反复执行,会把内存消耗完。 --------------------编程问答-------------------- ocr做成静态或全部变量,这样就不需要每次都Init了 --------------------编程问答--------------------
引用 3 楼 jshi123 的回复:
ocr做成静态或全部变量,这样就不需要每次都Init了

可以试试,每次做init的时候都比较消耗内存 --------------------编程问答-------------------- 自己也有用,幫頂中。 --------------------编程问答-------------------- 为什么我这里  每次执行到初始化的  
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false);  
这段代码这里就自动退出了   能否看看我的提问

http://topic.csdn.net/u/20120912/15/915bdd64-826e-4c25-b002-53cfecabd04f.html?seed=1608687446&r=79663190#r_79663190 --------------------编程问答-------------------- lz解决了没啊。我也遇到一样的问题。

推测是这段代码的问题:
  try
                {
                    result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
                    foreach (tessnet2.Word word in result)//遍历识别结果。
                    {
                        txt += word.Text;
                    }
                }
                catch (Exception ex)
                {

                }

http://bbs.csdn.net/topics/390277466?page=1#post-392888541 --------------------编程问答-------------------- tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
            string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
            if (!string.IsNullOrEmpty(txtCharList.Text))
            {
                defaultCharList = txtCharList.Text;
            }
            ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
            ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); 

ocr 有没有Dispose --------------------编程问答-------------------- 这是我写的tessnet3的demo 研究了两个星期.. http://download.csdn.net/detail/chen644733521/4662406 --------------------编程问答--------------------
引用 9 楼 chen644733521 的回复:
这是我写的tessnet3的demo 研究了两个星期.. http://download.csdn.net/detail/chen644733521/4662406


能解决内存泄漏问题吗 --------------------编程问答--------------------
引用 8 楼 chenandczh 的回复:
tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
            string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
            if (!string.IsNullOrEmpty(txtCharLis……


有Dispose。但是调用也不去作用 --------------------编程问答-------------------- 那定时进行手工 GC垃圾回收,应该会有效果的,内存会骤降。 --------------------编程问答--------------------  lz内存泄露解决了没? 还有怎么减少识别的时间呢。 --------------------编程问答-------------------- UP,我也碰到同样的问题
补充:.NET技术 ,  C#
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,