Share Lập Trình Ứng Dụng Nhận Diện Văn Bản Trong Hình Ảnh Trong VB.NET: Sử Dụng Optical Character Recognition (OCR) Libraries

Nhận dạng ký tự #optical #Ocl #vb.net #Image xử lý #Programming

## Lập trình Ứng dụng nhận dạng văn bản trong hình ảnh trong VB.NET: Sử dụng thư viện nhận dạng ký tự quang (OCR)

Nhận dạng ký tự quang học (OCR) là quá trình chuyển đổi hình ảnh của văn bản thành văn bản có thể đọc được bằng máy.Đây có thể là một công cụ hữu ích để trích xuất văn bản từ các tài liệu được quét, hình ảnh hoặc thậm chí các cảnh quay video.Trong hướng dẫn này, chúng tôi sẽ chỉ cho bạn cách lập trình một ứng dụng nhận dạng văn bản trong vb.net bằng thư viện [Tesseract OCR] (https://github.com/tesseract-oc/tesseract).

### Điều kiện tiên quyết

Để làm theo hướng dẫn này, bạn sẽ cần những điều sau đây:

* Máy tính chạy Windows, Mac hoặc Linux
* Visual Studio 2019 trở lên
* [Tesseract OCR] (https://github.com/tesseract-oc/tesseract) Thư viện

### Bắt đầu

Bước đầu tiên là cài đặt thư viện OCR Tesseract.Bạn có thể làm điều này bằng cách làm theo các hướng dẫn trên [trang web Tesseract OCR] (https://github.com/tesseract-oc/tesseract).

Khi bạn đã cài đặt Tesseract, bạn có thể tạo một dự án mới trong Visual Studio.Đối với hướng dẫn này, chúng tôi sẽ tạo một ứng dụng Windows Forms.

### Thêm thư viện OCR Tesseract vào dự án của bạn

Bước tiếp theo là thêm thư viện Tesseract OCR vào dự án của bạn.Để thực hiện việc này, nhấp chuột phải vào dự án của bạn trong Giải pháp Explorer và chọn "Thêm tham chiếu".Trong hộp thoại "Trình quản lý tham chiếu", nhấp vào nút "Duyệt" và điều hướng đến vị trí nơi bạn đã cài đặt Tesseract.Chọn tệp "libtesseract400.dll" và nhấp vào nút "Thêm".

### Mã hóa ứng dụng nhận dạng văn bản

Bây giờ bạn đã thêm thư viện Tesseract OCR vào dự án của mình, bạn có thể bắt đầu mã hóa ứng dụng nhận dạng văn bản.Sau đây là mã cho hình thức chính của ứng dụng:

`` `VBNet
Nhập khẩu System.Drawing.imaging
Nhập khẩu Tesseractoc

Lớp công khai Mẫu1
Công khai Sub mới ()
Khởi tạo ()
Kết thúc phụ

Nút phụ riêng1_click (người gửi dưới dạng đối tượng, e là EventArgs) Nút tay cầm1.Click
'Nhận hình ảnh từ hộp hình ảnh.
Hình ảnh mờ như bitmap = picturebox1.image

'Tạo một động cơ OCR mới.
Dim Engine là Tesseractengine mới ()

'Đặt ngôn ngữ của động cơ OCR.
động cơ.langage = "Eng"

'Đặt chế độ phân đoạn trang của động cơ OCR.
Động cơ.PagesegingationMode = Tesseractengine.PagesegmentationMode.Auto

'Nhận biết văn bản trong hình ảnh.
Dim văn bản dưới dạng chuỗi = động cơ.recognize (hình ảnh)

'Hiển thị văn bản trong hộp văn bản.
TextBox1.Text = Text
Kết thúc phụ
Kết thúc lớp học
`` `

Mã này tạo ra một đối tượng bitmap mới từ hình ảnh trong hộp hình ảnh.Sau đó, nó tạo ra một đối tượng Tesseractengine mới và đặt chế độ phân đoạn ngôn ngữ và trang của động cơ.Cuối cùng, nó gọi phương thức nhận dạng của động cơ để nhận ra văn bản trong hình ảnh và hiển thị văn bản trong hộp văn bản.

### Chạy ứng dụng nhận dạng văn bản

Khi bạn đã mã hóa ứng dụng nhận dạng văn bản, bạn có thể chạy nó bằng cách nhấn phím F5.Ứng dụng sẽ hiển thị một cửa sổ với hộp ảnh và hộp văn bản.Bạn có thể nhấp vào nút "Duyệt" để chọn một hình ảnh để xử lý.Khi bạn đã chọn một hình ảnh, ứng dụng sẽ nhận ra văn bản trong hình ảnh và hiển thị nó trong hộp văn bản.

### Phần kết luận

Trong hướng dẫn này, bạn đã học cách lập trình một ứng dụng nhận dạng văn bản trong VB.NET bằng thư viện Tesseract OCR.Đây là một công cụ mạnh mẽ có thể được sử dụng để trích xuất văn bản từ nhiều nguồn khác nhau, bao gồm các tài liệu, hình ảnh và cảnh quay video được quét.

### hashtags

* Nhận dạng nhân vật #optical
* #Ocr
* #vb.net
* #Đang xử lý hình ảnh
* #Programming
=======================================
#optical Character Recognition #Ocr #vb.net #Image Processing #Programming

## Programming the Text Identification Application in the Image in VB.NET: Using Optical Character Recognition (OCR) Libraries

Optical Character Recognition (OCR) is the process of converting images of text into machine-readable text. This can be a useful tool for extracting text from scanned documents, images, or even video footage. In this tutorial, we will show you how to program a text identification application in VB.NET using the [Tesseract OCR](https://github.com/tesseract-ocr/tesseract) library.

### Prerequisites

To follow this tutorial, you will need the following:

* A computer running Windows, Mac, or Linux
* Visual Studio 2019 or later
* The [Tesseract OCR](https://github.com/tesseract-ocr/tesseract) library

### Getting Started

The first step is to install the Tesseract OCR library. You can do this by following the instructions on the [Tesseract OCR website](https://github.com/tesseract-ocr/tesseract).

Once you have installed Tesseract, you can create a new project in Visual Studio. For this tutorial, we will create a Windows Forms application.

### Adding the Tesseract OCR Library to Your Project

The next step is to add the Tesseract OCR library to your project. To do this, right-click on your project in the Solution Explorer and select "Add Reference". In the "Reference Manager" dialog box, click on the "Browse" button and navigate to the location where you installed Tesseract. Select the "libtesseract400.dll" file and click on the "Add" button.

### Coding the Text Identification Application

Now that you have added the Tesseract OCR library to your project, you can start coding the text identification application. The following is the code for the main form of the application:

```vbnet
Imports System.Drawing.Imaging
Imports TesseractOCR

Public Class Form1
Public Sub New()
InitializeComponent()
End Sub

Private Sub Button1_Click(sender As Object, e As EventArgs) Handles Button1.Click
' Get the image from the picture box.
Dim image As Bitmap = PictureBox1.Image

' Create a new OCR engine.
Dim engine As New TesseractEngine()

' Set the language of the OCR engine.
engine.Language = "eng"

' Set the page segmentation mode of the OCR engine.
engine.PageSegmentationMode = TesseractEngine.PageSegmentationMode.Auto

' Recognize the text in the image.
Dim text As String = engine.Recognize(image)

' Display the text in the text box.
TextBox1.Text = text
End Sub
End Class
```

This code creates a new Bitmap object from the image in the picture box. It then creates a new TesseractEngine object and sets the language and page segmentation mode of the engine. Finally, it calls the Recognize method of the engine to recognize the text in the image and displays the text in the text box.

### Running the Text Identification Application

Once you have coded the text identification application, you can run it by pressing the F5 key. The application will display a window with a picture box and a text box. You can click on the "Browse" button to select an image to process. Once you have selected an image, the application will recognize the text in the image and display it in the text box.

### Conclusion

In this tutorial, you learned how to program a text identification application in VB.NET using the Tesseract OCR library. This is a powerful tool that can be used to extract text from a variety of sources, including scanned documents, images, and video footage.

### Hashtags

* #optical Character Recognition
* #Ocr
* #vb.net
* #Image Processing
* #Programming
 
Join Telegram ToolsKiemTrieuDoGroup
Back
Top