tessnet2.Tesseract ocr 耗尽内存
private void btnGo_Click(object sender, EventArgs e){
tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); //应用当前语言包。注,Tessnet2是支持多国语的。语言包下载链接:http://code.google.com/p/tesseract-ocr/downloads/list
WebClient wc = new WebClient();
byte[] oimg = wc.DownloadData(txtImageUrl.Text); // 自己修改成要识别的地址吧
Bitmap bp = new Bitmap(new MemoryStream(oimg), true);//识别图像
Bitmap bp2 = new Bitmap(new MemoryStream(oimg), true);
picBox1.Image = bp2;
picBox2.Image = bp;
List<tessnet2.Word> result = new List<tessnet2.Word>();
string txt = "";
try
{
result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
foreach (tessnet2.Word word in result)//遍历识别结果。
{
txt += word.Text;
}
}
catch (Exception ex)
{
}
wc.close();
bp.dispose();
bp2.dispose();
wc.close();
ocr.dispose();
GC.Collect();
GC.WaitForPendingFinalizers();
GC.Collect();
textBox1.Text = txt;
}
从网上下载了OCR.Tesseract.Demo1,测试时发现,这段代码每次都消耗内存, 重复多次使用后,把内存消耗完了。
最主要是下面几步:
tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false);
特别耗内存。
大家有没有好的解决办法? --------------------编程问答-------------------- 还没看明白 --------------------编程问答-------------------- 上面这段代如果放在while中反复执行,会把内存消耗完。 --------------------编程问答-------------------- ocr做成静态或全部变量,这样就不需要每次都Init了 --------------------编程问答--------------------
可以试试,每次做init的时候都比较消耗内存 --------------------编程问答-------------------- 自己也有用,幫頂中。 --------------------编程问答-------------------- 为什么我这里 每次执行到初始化的
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false);
这段代码这里就自动退出了 能否看看我的提问
http://topic.csdn.net/u/20120912/15/915bdd64-826e-4c25-b002-53cfecabd04f.html?seed=1608687446&r=79663190#r_79663190 --------------------编程问答-------------------- lz解决了没啊。我也遇到一样的问题。
推测是这段代码的问题:
try
{
result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
foreach (tessnet2.Word word in result)//遍历识别结果。
{
txt += word.Text;
}
}
catch (Exception ex)
{
}
http://bbs.csdn.net/topics/390277466?page=1#post-392888541 --------------------编程问答-------------------- tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false);
ocr 有没有Dispose --------------------编程问答-------------------- 这是我写的tessnet3的demo 研究了两个星期.. http://download.csdn.net/detail/chen644733521/4662406 --------------------编程问答--------------------
能解决内存泄漏问题吗 --------------------编程问答--------------------
有Dispose。但是调用也不去作用 --------------------编程问答-------------------- 那定时进行手工 GC垃圾回收,应该会有效果的,内存会骤降。 --------------------编程问答-------------------- lz内存泄露解决了没? 还有怎么减少识别的时间呢。 --------------------编程问答-------------------- UP,我也碰到同样的问题
补充:.NET技术 , C#