Sự khác biệt giữa Thị giác máy tính và Xử lý hình ảnh (Pc imaginative and prescient vs Picture processing) – Weblog | TheGioiMayChu

Giới thiệu

Nhiều người quen thuộc sở hữu những thuật ngữ Xử lý hình ảnh (Picture Proccessing) và Thị giác máy tính (có nơi còn gọi là Điện toán thị giác – Pc Imaginative and prescient), nhưng có lẽ 1 số trong ấy ko kiên cố điều gì làm cho nên sự khác biệt giữa 2 lĩnh vực này. Có cần chúng về cơ bản là giống nhau ko? Chúng có làm cho việc độc lập sở hữu nhau và được dùng cho những phần đích khác nhau? Hay chúng là 2 phần của cùng 1 quy trình? Trừ lúc ai ấy đã làm cho việc trong lĩnh vực này, họ có thể ko thể trả lời được những câu hỏi này. Hơn nữa, sở hữu sự phát triển thành của Deep Studying và hiệu quả của nó trong những tác vụ xử lý ảnh, nó có thể thích hợp để ứng dụng vào đâu?

Định nghĩa của từng dòng đã rõ, nhưng trước tiên, có lẽ nên xem xét những gì gây ra sự khó hiểu hay nhầm lẫn trong cùng đồng. Thị giác máy tính đôi lúc còn được coi là 1 tập con của Xử lý hình ảnh, trong ấy người ta tin rằng máy tính có thể giải thích, hiểu và dùng hình ảnh ưu thích mà nó có quyền truy cập. Trong thực tế, Xử lý hình ảnh có thể được dùng như 1 phần của quy trình Thị giác máy tính, hoặc độc lập và cho 1 phần đích khác.

Xử lý ảnh là gì?

Xử lý hình ảnh là 1 thuật ngữ chung đề cập tới 1 loạt những chức năng có thể được thực hành trên 1 hình ảnh tĩnh. Trong lúc 1 khuôn hình đơn (single body) được dùng làm cho đầu vào, đầu ra thay thế đổi tùy thuộc} theo 1 hoặc vài chức năng được ứng dụng.

Phần lớn những chức năng xử lý hình ảnh tạo ra 1 hình ảnh thứ 2, đã được can thiệp. Bất kỳ bộ lọc / filter nào làm cho thay thế đổi hình ảnh chẳng hạn, là 1 loại của Xử lý hình ảnh. Cho dù nó tô màu sắc cho ảnh chụp đen trắng, làm cho mờ biển số xe để bảo vệ quyền riêng tư hoặc tái tạo tai thỏ trên đầu của 1 người, ấy là 1 thí dụ về chuyển đổi từ hình ảnh này sang hình ảnh khác thông qua xử lý hình ảnh.

Sự khác biệt giữa Thị giác máy tính và Xử lý hình ảnh (Computer vision vs Image processing) - Blog | TheGioiMayChu

(Pc Imaginative and prescient hoạt động trên 1 luồng những hình ảnh)

1 công cụ thường được dùng để xử lý hình ảnh là Adobe Photoshop. Việc dùng siêu phẩm này để thay thế đổi hình ảnh siêu phổ thông} tới nỗi kết quả cuối cùng, sau thời điểm 1 bức ảnh kỹ thuật số đã được chỉnh sửa, thường được gọi là 1 bức ảnh đã “được photoshop”.

Ngược lại, Xử lý hình ảnh ko đề cập tới quy trình phân tách 1 hình ảnh, thí dụ, tạo 1 câu tiếng Anh thích hợp để mô tả nó 1 phương pháp ưu thích. Điều này thuộc lĩnh vực machine studying, và trên thực tế, cũng là 1 phần của Thị giác máy tính.

Thời điểm này} chúng ta đã có 1 định nghĩa cho Xử lý hình ảnh, nó liên quan như thế nào tới Thị giác máy tính?

Thị giác máy tính là gì?

Thị giác máy tính, Pc Imaginative and prescient, được coi là 1 định nghĩa duy nhất, là khả năng và quy trình để máy tính hiểu được môi trường xung quanh thông qua việc dùng 1 hoặc nhiều mắt kỹ thuật số. Rõ ràng, điều này ko được thực hành bằng phương pháp dùng 1 nhiệm vụ độc lập. Thay thế vào ấy, ấy là 1 loạt những bước khởi đầu bằng việc có được hình ảnh trước tiên, và tiếp theo đạt được sự hiểu biết thông qua xử lý và phân tách hình ảnh.

Thị giác của con người là 1 quy trình phức tạp và việc mô phỏng điều này luôn là 1 nhiệm vụ đầy thách thức đối sở hữu máy tính. Thông qua việc dùng những kỹ thuật machine studying cổ điển và sắp đây sở hữu những tiến bộ trong Deep Studying, có những tiến bộ đáng chú ý đang được thực hành trong những máy tính có khả năng diễn giải và phản ứng sở hữu những gì chúng “thấy”.

Xem Thêm  Ngày Cyber Monday là gì và diễn ra vào ngày nào 5 2023?

1 điều kiện tiên quyết và quan yếu cho Thị giác máy tính khác sở hữu Xử lý hình ảnh là việc thực hiện trên nhiều hình ảnh. Trong lúc Xử lý hình ảnh hoàn toàn hoạt động sở hữu duy nhất 1 tấm hình tại dạng số hóa, Pc Imaginative and prescient hoạt động ưu thích hơn trên 1 luồng hình ảnh (stream of photographs) có mối quan hệ tạm thời đã biết trước.

Sự khác biệt giữa Thị giác máy tính và Xử lý hình ảnh (Computer vision vs Image processing) - Blog | TheGioiMayChu

(Xử lý ảnh được thực hành trên 1 ảnh tĩnh)

Chuỗi hình ảnh

Sự kết nối tạm thời giữa những hình ảnh siêu quan yếu vì nó bổ sung bối cảnh thông thường là cần thiết để đưa ra những kết luận chính xác và ưu thích. Dí dụ, hãy xem xét 1 bức tranh kỹ thuật số có chứa 1 cái xe tương đối. Việc phân tách 1 hình ảnh duy nhất sẽ có khả năng mang trong mình lại những chi tiết quan yếu và quan yếu về cái xe. Chúng có thể bao gồm nhãn hiệu, kiểu dáng, màu sắc sắc, biển số xe, sự hiện diện của người cư ngụ và có lẽ những chỉ dẫn như đèn hoặc khí thải ngụ ý trạng thái hoạt động. Tuy nhiên, sẽ khá hiếm lúc quyết định có thể đưa ra quyết định rằng cái xe đang chuyển động.

Vững chắc chắn có những thí dụ về nơi mà những cảnh chuyển động có thể được nhận ra. Chúng có thể bao gồm 1 hình ảnh mờ chuyển động, hoặc 1 bức ảnh chụp vào đúng thời điểm mà 1 trong những cái lốp xe vượt qua vũng nước. Mặt khác, ko khó để nhận ra rằng phần lớn những hình ảnh 1 khuôn hình sẽ ko phân phối đủ thông tin để suy ra chuyển động, chứ chưa nói tới hướng hoặc tốc độ đi lại. Ko có những chi tiết này, độ sâu của sự hiểu biết bị hạn chế đáng nhắc.

(Xử lý 1 chuỗi những hình ảnh của cùng 1 sự kiện xác định rằng cái xe đang chuyển động)

Thay thế vì 1 hình ảnh duy nhất, hãy xem xét 1 loạt cha hình ảnh có chứa cùng 1 cái xe. Từng dòng được lấy từ cùng 1 vùng tiện lợi và được đánh dấu thời kì tương ứng. Ví dụ có độ trễ giữa những lần chụp ảnh thì có thể dễ dàng tính toán bằng phương pháp trừ những dấu thời kì. Trong kịch bản này, việc xác định chuyển động trong khoảng thời kì có liên quan sẽ dễ dàng hơn nhiều.

Cái xe có thể đang đi sang trái hoặc cần, liên quan tới góc xem, và điều này sẽ rõ ràng bằng phương pháp nhìn vào những hình ảnh theo thứ tự động. Tương tự động, trường hợp 1 cái xe đang đi lại về phía trước hoặc ra khỏi máy ảnh thì hình ảnh của nó sẽ trở nên lớn hơn hoặc bé hơn, tương ứng. Có phần đích của thí dụ này, chúng tôi sẽ ko xem xét những trường hợp 1 đối tượng đang chuyển động, nhưng ko thể tìm ra được vì độ trễ và chuyển động cùng nhau, sao cho đối tượng luôn quay trở lại cùng 1 vùng cho từng ảnh chụp.

Deep studying và hình ảnh kỹ thuật số

Có sự phát triển thành của Deep Studying trong những 5 sắp đây, 1 trong những lĩnh vực được ứng dụng phổ biến là hình ảnh kỹ thuật số. 2 framework Deep Studying nổi danh là Mạng thần kinh chuyển đổi (CNN) và Mạng thần kinh tái phát (RNN) . Dù rằng 1 cuộc thảo luận sâu hơn về những điều này nằm bên cạnh phạm vi của bài viết này, có liên quan để đề cập rằng CNN đã được ứng dụng cho 1 loạt những nhiệm vụ hình ảnh. Chúng bao gồm hệ thống nhận diện và nhận dạng khuôn mặt, phân tách hình ảnh y tế, nhận dạng hình ảnh và phân tách video chuyển động toàn bộ. Trên hệ thống như vậy là AlexNet, 1 CNN đã lôi kéo sự chú ý lúc thắng lợi Thử thách nhận dạng hình ảnh quy mô lớn ImageNet 2012.

Xem Thêm  5 2023 mệnh gì? Bố mẹ tuổi gì nên sinh em bé 5 2023

Deep studying để xử lý ảnh

Những kỹ thuật Deep Studying đã được ứng dụng thành công trong những tác vụ Xử lý hình ảnh và 1 thí dụ đơn giản cho việc dùng nó là trong kỹ thuật tìm ra cạnh, Edge Detection. Việc tìm ra những cạnh trong ảnh kỹ thuật số tương đối phức tạp và nó quan yếu trong Xử lý hình ảnh. Hãy xem xét thí dụ trước đây của chúng tôi trong ấy 1 hình ảnh duy nhất chứa hình ảnh của 1 cái ô tô và nhiệm vụ trong tay là ứng dụng bộ lọc mờ sao cho số biển số xe tiếp theo bị che khuất.

Ví dụ chúng tôi xem xét những bước cần thiết để thực hành công việc dễ tưởng tượng này, trước tiên cần là định vị biển số xe. Xác định những mẫu hình trực quan, chẳng hạn như biển số xe hoặc đèn pha, được gọi là nhận diện mẫu hình. Tuy nhiên, trước lúc những mẫu hình có thể được nhận ra, cần cần kiếm tìm những đường viền hoặc cạnh biên, được tạo thành từ những cạnh của nó. Do ấy, nhận diện cạnh là 1 thành phần quan yếu của nhận diện mẫu hình, để tiếp theo có thể ứng dụng những bộ lọc khác nhau.

Lúc biển số xe đã được xác định, ấy chỉ là 1 trường hợp làm cho xáo trộn chuỗi ký tự động trong khu vực của nó. Kết quả là 1 bức hình thứ 2 y hệt nhau trong từng chi tiết, ngoại trừ thông tin nhận dạng duy nhất ko còn rõ ràng nữa.

Nhận diện cạnh và tác vụ phức tạp hơn là nhận diện mẫu hình, được CNNs xử lý dễ dàng trong những hệ thống Deep Studying. Bằng phương pháp xác định những mẫu hình, CNN có khả năng phân loại ảnh và đưa ra những loại dự đoán khác. Điều này dẫn tới câu hỏi quan yếu là liệu CNN có thể được ứng dụng cho những tác vụ của Thị giác máy tính hay ko.

(Dí dụ về Nhận diện cạnh được ứng dụng trên biển số xe)

Deep studying cho Thị giác máy tính

Ko còn nghi ngờ gì nữa, nhận dạng mẫu hình và phân loại hình ảnh là những công cụ quan yếu để hiểu được nội dung của 1 bức ảnh. Do ấy, CNN là 1 công cụ có giá trị được dùng bởi những hệ thống Pc Imaginative and prescient. Nhưng còn về bối cảnh thì sao? Cái xe đang tiến tới sắp bạn hay nó đang đi lại ra xa hơn? Ví dụ ko xem xét 1 loạt những hình ảnh và mối quan hệ tạm thời của chúng, ko có phương pháp nào để biết 1 phương pháp kiên cố chắn. Trong Thị giác máy tính, hiểu biết sâu hơn đối sở hữu những sự kiện là điều cần thiết.

Deep Studying framework thứ 2 như đề cập tại trên ấy là RNN. CNN phải chăng cho xử lý hình ảnh, trong lúc RNN phải chăng cho việc khai thác thông tin tạm thời để xác định bối cảnh. 1 RNN chứa 1 cơ chế vòng phản hồi về cơ bản hoạt động như 1 bộ nhớ trong. Được đặt tên là “Bộ nhớ ngắn hạn” dài (Lengthy Quick-Time period Reminiscence, LSTM), chức năng này có thể khám phá nhiều loại quan hệ bao gồm cả những mối quan hệ chỉ rõ ràng lúc xem xét bối cảnh. Những hệ thống này thường được dùng để dự đoán từ tiếp theo trong tác vụ tự động động hoàn thành, trong ấy lựa chọn chính xác phụ thuộc vào điều gì ấy xảy ra tại 1 điểm trước ấy trong câu.

Xem Thêm  LDR là gì? Công thức tính LDR? Tỷ lệ LDR bao nhiêu là hợp lý?

(1 thí dụ về chú thích ảnh)

Đối sở hữu trường hợp 1 hình ảnh kỹ thuật số duy nhất, 1 trong những ứng dụng mà RNN được ứng dụng được gọi là Chú thích hình ảnh. Trên ấy, 1 hình ảnh được tự động động đặt cho 1 mẫu chú thích dựa trên những gì có trong hình ảnh, chẳng hạn như “phương tiện này là 1 cái xe ô tô” hay “cửa bên tài xế đang mở ra”. Rõ ràng là mức độ hiểu biết này có lợi ích siêu lớn trong Thị giác máy tính. Hơn nữa, sức mạnh của LSTM có thể được dùng trên 1 loạt những hình ảnh.

Được trang bị 1 bộ hình ảnh, RNN sẽ xem xét cả nội dung của hình ảnh và mối quan hệ tạm thời giữa chúng, như được mô tả bởi timestamp đi kèm của chúng. Thời điểm này} hãy xem xét rằng từng hình ảnh có 1 mô tả chính xác và mô tả ấy được đặt theo thứ tự động, trong số 1 số mô tả tương tự động và kết quả là 1 đoạn mô tả những gì đang xảy ra trong 1 khoảng thời kì đã được ghi lại trong 1 số hình ảnh. Đây là 1 mô tả chi tiết hơn, hoặc hiểu biết hơn về những gì đang xảy ra trong khoảng thời kì có liên quan.

Trong thực tế, những hệ thống CNN và RNN “hybrid” được dùng cho những tác vụ phức tạp hơn, dùng từng framework này. Có 1 hệ thống lai như vậy, có tên gọi là DanQ, đã được tạo ra sở hữu hệ thống DeepSEA làm cho ứng dụng. Tuy nhiên, DeepSEA chỉ là 1 CNN và ko bao gồm RNN. Thử nghiệm đã chỉ ra rằng hệ thống hài hòa nổi bậc so sở hữu người nhiệm kỳ trước đó vì RNN chỉ xem xét dữ liệu trừu tượng hơn đã được CNN lọc trước, giúp mối quan hệ nhiều ngày dài dễ dàng tìm ra hơn. Tuy nhiên, điều này phụ thuộc vào việc thực hành và điều này có lẽ nằm bên cạnh phạm vi của bài thảo luận này.

Phần kết luận

Xử lý hình ảnh và Thị giác máy tính là những nhiệm vụ biệt lập nhưng có liên quan thuộc bối cảnh của lĩnh vực ảnh số. Xử lý hình ảnh liên quan tới việc sửa đổi hình ảnh bằng những thiết bị như bộ lọc, trong lúc những hệ thống Pc Imaginative and prescient nhằm tìm hiểu những gì đang xảy ra trong 1 khoảng thời kì đã được “mắt điện tử” chụp lại. Xử lý hình ảnh, trong lúc nó có những ứng dụng riêng, là 1 phần quan yếu của hệ thống Thị giác máy tính.

Những hệ thống Deep Studying đã được ứng dụng thành công cho cả những tác vụ Xử lý hình ảnh và Thị giác máy tính, dùng nhiều framework và triển khai hài hòa. Có sự tiến bộ trong những thuật toán Deep Studying và khả năng tính toán ngày càng nâng cao, những hệ thống Pc Imaginative and prescient kiên cố chắn sẽ được cải thiện. Đổi lại, những ứng dụng từ máy ảnh thông minh tới robotic cũng sẽ tiếp tục cải tiến, cuối cùng đưa Pc Imaginative and prescient trở nên xu hướng chủ đạo và bước ra khỏi phòng lab.

Nguồn Tổng hợp