Walton Electronics Co., Ltd.
Liên hệ chúng tôi

Người liên hệ : Walton-cara

Số điện thoại : 15986872308

Free call

Học máy yêu cầu nhiều bước

July 18, 2022

Giới thiệu

Triển khai học máy (ML) là một quá trình gồm nhiều bước.Nó bao gồm việc lựa chọn một mô hình, đào tạo nó cho một nhiệm vụ cụ thể, xác nhận nó với dữ liệu thử nghiệm, sau đó triển khai và giám sát mô hình đó trong quá trình sản xuất.Ở đây, chúng tôi sẽ thảo luận về các bước này và chia nhỏ chúng để giới thiệu với bạn về ML.ML đề cập đến các hệ thống, không có hướng dẫn rõ ràng, có khả năng học hỏi và cải thiện.Các hệ thống này học từ dữ liệu để thực hiện một nhiệm vụ hoặc chức năng cụ thể.Trong một số trường hợp, học tập.hoặc đào tạo cụ thể hơn, xảy ra theo cách có giám sát trong đó kết quả đầu ra không chính xác dẫn đến việc điều chỉnh mô hình để thúc đẩy nó về phía đầu ra chính xác.Trong các trường hợp khác, việc học không được giám sát xảy ra khi hệ thống tổ chức dữ liệu để tiết lộ các mẫu chưa biết trước đó.Hầu hết các mô hình ML tuân theo hai mô hình này (học có giám sát và không giám sát).Bây giờ chúng ta hãy tìm hiểu ý nghĩa của một mô hình và sau đó khám phá cách dữ liệu trở thành nhiên liệu cho sự nhảy vọt của máy móc.Mô hình học máy Mô hình là một bản tóm tắt của một giải pháp cho học máy.Mô hình xác định kiến ​​trúc。, sau khi được đào tạo, sẽ trở thành một triển khai.Do đó, chúng tôi không triển khai các mô hình.Chúng tôi triển khai việc triển khai các mô hình được đào tạo từ dữ liệu (thêm về điều này trong phần tiếp theo).Vì vậy, các mô hình cộng với dữ liệu cộng với đào tạo các thể hiện bằng nhau của các giải pháp ML (Hình 1).bản dịch là bắt buộc.Ví dụ, việc cung cấp dữ liệu văn bản vào một mạng học sâu đòi hỏi phải mã hóa các từ thành dạng số, thường là một vectơ chiều cao với các từ khác nhau có thể được sử dụng.Tương tự, đầu ra có thể yêu cầu dịch từ dạng số trở lại dạng văn bản.Mô hình ML có nhiều loại, bao gồm mô hình mạng nơ-ron, mô hình Bayes, mô hình hồi quy, mô hình phân cụm, v.v.Mô hình mà bạn chọn dựa trên vấn đề hiện tại.Trong bối cảnh của mạng nơ-ron, các mô hình trải dài từ mạng nhiều lớp nông đến mạng nơ-ron sâu bao gồm nhiều lớp

của các tế bào thần kinh chuyên biệt (đơn vị xử lý).Mạng nơron sâu cũng có một loạt các mô hình có sẵn dựa trên ứng dụng mục tiêu của bạn.

Ví dụ:

● Nếu ứng dụng của bạn tập trung vào việc xác định các đối tượng trong hình ảnh, thì Mạng thần kinh kết hợp (CNN) là một mô hình lý tưởng.CNN đã được áp dụng để phát hiện ung thư da và làm tốt hơn các bác sĩ da liễu thông thường.

● Nếu ứng dụng của bạn liên quan đến việc dự đoán hoặc tạo ra các chuỗi phức tạp (chẳng hạn như các câu tiếng người), thì Mạng thần kinh định kỳ (RNN) hoặc mạng Bộ nhớ dài-ngắn hạn (LSTM) là những mô hình lý tưởng.LSTM cũng đã được áp dụng để dịch máy các ngôn ngữ của con người.

● Nếu ứng dụng của bạn liên quan đến việc mô tả nội dung của hình ảnh bằng tiếng người, thì có thể sử dụng kết hợp CNN và LSTM (trong đó hình ảnh được đưa vào CNN và đầu ra của CNN đại diện cho đầu vào của LSTM, phát ra các chuỗi từ).

● Nếu ứng dụng của bạn liên quan đến việc tạo hình ảnh thực tế (chẳng hạn như phong cảnh hoặc khuôn mặt), thì Mạng đối thủ chung (GAN) đại diện cho mô hình hiện đại.Các mô hình này đại diện cho một số kiến ​​trúc mạng nơron sâu phổ biến hơn đang được sử dụng ngày nay.Mạng nơron sâu phổ biến vì chúng có thể chấp nhận dữ liệu phi cấu trúc như hình ảnh, video hoặc thông tin âm thanh.Các lớp trong mạng xây dựng một hệ thống phân cấp các tính năng cho phép chúng nắm bắt các thông tin rất phức tạp.Mạng nơron sâu đã chứng tỏ hiệu suất hiện đại trên nhiều lĩnh vực vấn đề.Nhưng giống như các mô hình ML khác, độ chính xác của chúng phụ thuộc vào dữ liệu.Hãy cùng khám phá khía cạnh này tiếp theo.

Dữ liệu và đào tạo

Dữ liệu là nhiên liệu thúc đẩy máy học, không chỉ trong hoạt động mà còn xây dựng giải pháp ML thông qua đào tạo mô hình.Trong bối cảnh đào tạo dữ liệu cho mạng nơ-ron sâu, điều quan trọng là phải khám phá dữ liệu cần thiết trong bối cảnh số lượng và chất lượng.Mạng nơron sâu đòi hỏi một lượng lớn dữ liệu để đào tạo.Một nguyên tắc chung để phân loại dựa trên hình ảnh là 1.000 hình ảnh

mỗi lớp.Nhưng câu trả lời là phụ thuộc vào độ phức tạp của mô hình và khả năng chịu lỗi.Một số ví dụ từ các giải pháp ML sản xuất mang lại nhiều kích thước tập dữ liệu.Một hệ thống phát hiện và nhận dạng khuôn mặt yêu cầu 450.000 hình ảnh và một chatbot hỏi và trả lời đã được đào tạo với 200.000 câu hỏi được ghép nối với 2 triệu câu trả lời.Các bộ dữ liệu nhỏ hơn cũng có thể đủ dựa trên sự cố đang được giải quyết.Một giải pháp phân tích tình cảm giúp xác định sự phân cực của quan điểm từ văn bản viết chỉ cần hàng chục nghìn mẫu.Chất lượng dữ liệu cũng quan trọng như số lượng.Với bộ dữ liệu lớn cần thiết cho việc đào tạo, ngay cả một lượng nhỏ dữ liệu đào tạo sai sót cũng có thể dẫn đến một giải pháp kém.Tùy thuộc vào loại dữ liệu cần thiết, dữ liệu của bạn có thể trải qua quá trình làm sạch.Điều này đảm bảo rằng tập dữ liệu là nhất quán, không có dữ liệu trùng lặp, chính xác và đầy đủ (thiếu dữ liệu không hợp lệ hoặc không đầy đủ).Các công cụ tồn tại để hỗ trợ quá trình này.Việc xác thực dữ liệu về độ chệch cũng rất quan trọng để đảm bảo rằng dữ liệu không dẫn đến giải pháp ML sai lệch.Đào tạo ML hoạt động dựa trên dữ liệu số, vì vậy có thể cần một bước xử lý trước tùy thuộc vào giải pháp của bạn.Ví dụ: nếu dữ liệu của bạn là ngôn ngữ của con người, thì trước tiên dữ liệu đó phải được dịch sang dạng số để xử lý.Hình ảnh có thể được xử lý trước để có tính nhất quán.Ví dụ, hình ảnh được đưa vào mạng nơ-ron sâu sẽ được thay đổi kích thước và làm mịn để loại bỏ nhiễu (trong số các hoạt động khác).Một trong những vấn đề lớn nhất trong ML là có được tập dữ liệu để đào tạo giải pháp ML của bạn.Đây có thể là nỗ lực lớn nhất tùy thuộc vào vấn đề của bạn vì nó có thể không tồn tại và cần một nỗ lực riêng

để nắm bắt.Cuối cùng, tập dữ liệu nên được phân đoạn giữa dữ liệu đào tạo và dữ liệu kiểm tra.Phần đào tạo được sử dụng để đào tạo mô hình và sau khi được đào tạo, dữ liệu thử nghiệm được sử dụng để xác nhận độ chính xác của giải pháp

 

Hãy liên lạc với chúng tôi

Nhập tin nhắn của bạn