Ảnh trong sản phẩm tính
Hệ màu RGB
RGB viết tắt của red (đỏ), green (xanh lục), blue (xanh lam), là ba màu bao gồm của tia nắng khi tách ra từ bỏ lăng kính. Khi trộn bố màu trên theo tỉ lệ độc nhất vô nhị định có thể tạo thành các màu không giống nhau.
Bạn đang xem: Xử lý ảnh là gì

Với mỗi cỗ 3 số r, g, b nguyên trong tầm <0, 255> sẽ đã cho ra một màu không giống nhau. Do gồm 256 cách chọn r, 256 biện pháp chọn màu sắc g, 256 biện pháp chọn b => tổng cộng màu rất có thể tạo ra bằng hệ color RGB là: 256 * 256 * 256 = 16777216 color !!!
Ảnh màu
Ví dụ về ảnh màu

Bạn sẽ thấy chiều dài ảnh là 800 pixels (viết tắt px), chiều rộng 600 pixels, form size là 800 * 600. Trước giờ đồng hồ chỉ học đơn vị chức năng đo là mét tốt centimet, pixel là gì nhỉ ?
Theo wiki, pixel (hay điểm ảnh) là một trong khối màu sắc rất nhỏ và là đơn vị cơ phiên bản nhất để tạo nên một bức hình ảnh kỹ thuật số.
Vậy bức hình ảnh trên form size 800 pixel * 600 pixel, hoàn toàn có thể biểu diễn bên dưới dạng một ma trận form size 600 * 800 (vì có mang ma trận là số hàng nhân số cột).

Mỗi ma trận được bóc ra được gọi là một channel nên ảnh màu được gọi là 3 channel: channel red, channel green, channel blue.
Tóm tắt: Ảnh màu là một trong ma trận các px mà mỗi pixel biểu diễn một điểm màu. Từng điểm màu được màn trình diễn bằng bộ 3 số (r,g,b). Để luôn tiện cho bài toán xử lý hình ảnh thì sẽ bóc ma trận pixel ra 3 channel red, green, blue.
Tensor là gì
Khi dữ liệu biểu diễn dạng 1 chiều, fan ta hotline là vector, mang định lúc viết vector sẽ viết dưới dạng cột.
Xem thêm: Hướng Dẫn Cài Đặt Ngày Giờ Cho Android Tự Động, Cách Đổi Múi Giờ Trên Điện Thoại Android Và Ios
Khi tài liệu dạng 2 chiều, fan ta call là ma trận, form size là số sản phẩm * số cột.

Tưởng tượng dưới đáy là một ma trận kích cỡ a * b, được tạo do b vector kích cỡ a. Cả hình hộp là tensor 3 chiều form size a*b*h, được tạo bởi vì xếp h ma trận size a*b lên nhau.
Do đó biểu diễn ảnh màu trên laptop ở phần trên sẽ được biểu diễn bên dưới dạng tensor 3 chiều size 600*800*3 do có 3 ma trận (channel) color red, green, blue form size 600*800 ck lên nhau.
Ví dụ biểu diễn hình ảnh màu kích thước 28*28, màn biểu diễn dưới dạng tensor 28*28*3

Tương tự ảnh màu, hình ảnh xám cũng có thể có kích thước 800 pixel * 600 pixel, rất có thể biểu diễn bên dưới dạng một ma trận kích thước 600 * 800 (vì khái niệm ma trận là số hàng nhân số cột).
Tuy nhiên mỗi px trong ảnh xám chỉ cần biểu diễn bằng một giá trị nguyên trong khoảng từ <0,255> thay bởi (r,g,b) như trong hình ảnh màu. Vì vậy khi biểu diễn ảnh xám trong thứ tính chỉ cần một ma trận là đủ.

Padding
Như nghỉ ngơi trên thì từng lần thực hiện phép tính convolution kết thúc thì size ma trận Y đều nhỏ hơn X. Tuy vậy giờ ta ước ao ma trận Y thu được có kích thước bằng ma trận X => tìm kiếm cách xử lý cho các phần tử ở viền => Thêm giá trị 0 ở viền bên ngoài ma trận X.

Tuy nhiên trường hợp stride=k (k > 1) thì ta chỉ triển khai phép tính convolution trên các thành phần x_1+i*k,1+j*k. Ví dụ như k = 2.

Bài 4: Backpropagation
Search for:
Bài viết ngay gần đây
Mục bài bác viết
Deep Learning cơ bạn dạng ©2022. All Rights Reserved. Powered by WordPress.Theme by Phoenix website Solutions