Viễn cảnh về một tương lai mà chúng ta không cần phải lái xe thực sự hấp dẫn đối với nhiều người. Sự háo hức của chúng ta khi nhìn thấy những chiếc xe tự hành trên đường phố là một cơ hội thú vị mà nhiều nhà sản xuất ô tô đang tìm cách khai thác.
Xe tự hành là một thị trường tiềm năng to lớn: Chỉ riêng thị trường xe bán và tự lái hoàn toàn ở Bắc Mỹ đã trị giá 1,7 tỷ USD vào năm 2016 và dự kiến sẽ tăng lên hơn 26,2 tỷ USD vào năm 2030.
Để đảm bảo an toàn và an ninh bảo mật cho các phương tiện tự hành, các quốc gia sẽ cần có cơ sở hạ tầng thích hợp. Và các cơ quan làm luật sẽ có nhiệm vụ lập pháp và điều chỉnh ngành, cả trên toàn cầu và địa phương.
Nhưng các nhà sản xuất và nhà cung cấp có trách nhiệm cao nhất trong việc đảm bảo rằng xe tự lái có thể vận hành an toàn. Tại đây, học máy (machine learning – ML) đang được sử dụng làm đầu vào cho sự phát triển của công nghệ xe tự hành.
Xác định cách thức cung cấp những phương tiện không người lái an toàn, tiết kiệm và thiết thực đó là một trong những thách thức kỹ thuật thử nghiệm nhất của thời đại chúng ta. Học máy đang giúp các công ty vượt qua thách thức đó. Nhưng nó sẽ đóng vai trò gì? Và nó sẽ định hình giao thông toàn cầu như thế nào trong tương lai?
Tại sao chúng ta cần Xe Tự Hành?
Mặc dù có vẻ hấp dẫn khi chỉ việc ngồi vào và để chiếc xe đảm nhiệm việc điều khiển, nhưng điều này có phải chỉ đơn giản là sự lười biếng bẩm sinh của con người và nhu cầu của chúng ta ngày càng phù hợp với lịch trình bận rộn của mình? Hay có những lý do nào khác để ủng hộ sự phát triển của xe tự hành?
Trên toàn cầu, khoảng 1,25 tỷ ca tử vong do giao thông đường bộ xảy ra hàng năm. Và theo Bộ Giao thông Vận tải Hoa Kỳ, “Yếu tố chính dẫn đến 94% các vụ tai nạn chết người là do lỗi của con người.” Vì vậy, hãy yên tâm, việc sử dụng nhiều hơn các phương tiện tự hành có thể hạn chế những sai lầm mà con người đang mắc phải và loại bỏ hàng triệu cái chết có thể tránh được.
Đối với lĩnh vực thương mại, xe tự lái có thêm sức hấp dẫn là giảm chi phí. Giao hàng không cần người lái đồng nghĩa với việc giảm chi phí lao động cho tài xế xe tải, cộng với hiệu quả bổ sung liên quan đến việc nhân viên có thể làm việc gì đó năng suất hơn trong khi xe chạy.
Cách học máy có thể được sử dụng trong xe tự hành
Mặc dù các phương tiện tự hành về cơ bản mới chỉ ở giai đoạn tạo mẫu và thử nghiệm, ML đã được áp dụng cho một số khía cạnh của công nghệ được sử dụng trong các hệ thống hỗ trợ người lái tiên tiến (advanced driver-assistance system – ADAS). Và có vẻ như nó cũng đóng một vai trò quan trọng trong các phát triển trong tương lai.
Phát hiện và phân loại đối tượng
Máy học đang được triển khai cho các cấp độ hỗ trợ người lái cao hơn, chẳng hạn như nhận thức và hiểu biết về thế giới xung quanh chiếc xe. Điều này chủ yếu liên quan đến việc sử dụng các hệ thống dựa trên camera để phát hiện và phân loại các đối tượng, nhưng cũng có những phát triển trong LiDAR và radar.
Một trong những vấn đề lớn nhất đối với việc lái xe tự hành là các đối tượng bị phân loại sai. Dữ liệu được thu thập bởi các cảm biến khác nhau của xe được thu thập và sau đó được thông dịch bởi hệ thống của xe. Nhưng chỉ với một vài pixel khác biệt trong hình ảnh do hệ thống camera tạo ra, một chiếc xe có thể nhận thức sai biển báo dừng như một thứ gì đó vô hại hơn, chẳng hạn như biển báo giới hạn tốc độ. Tương tự, nếu hệ thống nhầm người đi bộ với một cột đèn, thì hệ thống sẽ không đoán trước được rằng người đó có thể di chuyển.
Thông qua việc đào tạo các mô hình ML được cải tiến và tổng quát hơn, các hệ thống có thể cải thiện nhận thức và xác định các đối tượng với độ chính xác cao hơn. Việc đào tạo hệ thống — bằng cách cung cấp cho nó các đầu vào đa dạng hơn về các tham số chính mà hệ thống đưa ra quyết định — giúp xác thực dữ liệu tốt hơn và đảm bảo rằng những gì nó đang được đào tạo là đại diện cho phân phối thực trong cuộc sống thực. Bằng cách này, không có sự phụ thuộc quá nhiều vào một tham số đơn lẻ hoặc một tập hợp các chi tiết chính, điều này có thể khiến hệ thống đưa ra một kết luận nhất định.
Nếu một hệ thống được cung cấp dữ liệu là 90% về ô tô màu đỏ, thì có nguy cơ nó sẽ xác định tất cả các đối tượng màu đỏ là ô tô màu đỏ. Việc “trang bị quá mức” này trong một khu vực có thể làm lệch dữ liệu và do đó làm sai lệch kết quả đầu ra; do đó, đào tạo đa dạng là rất quan trọng.
Giám sát tài xế
Mạng nơ-ron có thể nhận dạng các mẫu, vì vậy chúng có thể được sử dụng trong xe để giám sát người lái. Ví dụ: nhận dạng khuôn mặt có thể được sử dụng để xác định người lái xe và xác minh xem người đó có các quyền nhất định hay không, chẳng hạn như quyền khởi động xe, điều này có thể giúp ngăn chặn hành vi trộm cắp và sử dụng trái phép.
Tiến xa hơn nữa, hệ thống có thể sử dụng tính năng phát hiện có người để giúp tối ưu hóa trải nghiệm cho những người khác trong xe. Điều này có thể giúp tự động điều chỉnh máy lạnh để tương ứng với số lượng và vị trí của hành khách.
Trong ngắn hạn, các phương tiện sẽ cần một mức độ giám sát và chú ý từ người được chỉ định là “người lái xe”. Ở đây, nhận dạng các nét mặt sẽ là chìa khóa để tăng cường an toàn. Hệ thống có thể được sử dụng để tìm hiểu và phát hiện các dấu hiệu của sự mệt mỏi hoặc thiếu chú ý, và cảnh báo những người ngồi trong xe, thậm chí có thể giảm tốc độ hoặc dừng xe.
Thay thế người lái
Nếu chúng ta lấy quyền tự chủ hoàn toàn làm mục tiêu cuối cùng của xe tự hành, thì các hệ thống tự động sẽ cần phải thay thế người lái xe — thay thế hoàn toàn tất cả đầu vào của con người.
Ở đây, vai trò của máy học sẽ là lấy dữ liệu đầu vào từ một loạt các cảm biến, để ADAS có thể hiểu thế giới xung quanh chiếc xe một cách chính xác và an toàn. Bằng cách này, hệ thống sau đó có thể kiểm soát hoàn toàn tốc độ và hướng của xe, cũng như phát hiện, nhận biết, theo dõi và dự đoán đối tượng.
Tuy nhiên, an ninh là chìa khóa ở đây. Chạy trên chế độ lái tự động sẽ đòi hỏi những cách thức giám sát cực kỳ hiệu quả và được đảm bảo – nếu người lái xe đang chú ý hoặc có thể can thiệp nếu có vấn đề.
Tầm nhìn, Thị giác
Phần mềm khuôn khổ học sâu Deep-learning như Caffe và TensorFlow của Google sử dụng các thuật toán để đào tạo và kích hoạt mạng thần kinh. Chúng có thể được sử dụng với quá trình xử lý hình ảnh để tìm hiểu về các đối tượng và phân loại chúng, để xe có thể dễ dàng phản ứng với môi trường xung quanh nó. Điều này có thể là để phát hiện làn đường, trong đó hệ thống xác định các góc lái cần thiết để tránh các đối tượng hoặc ở trong làn đường cao tốc, và do đó dự đoán chính xác con đường phía trước.
Mạng nơron cũng có thể được sử dụng để phân loại các đối tượng. Với ML, chúng có thể được dạy về hình dạng cụ thể của các đối tượng khác nhau. Ví dụ: chúng có thể phân biệt giữa ô tô, người đi bộ, người đi xe đạp, cột đèn và động vật.
Hình ảnh cũng có thể được sử dụng để ước tính khoảng cách gần của một đối tượng, cùng với tốc độ và hướng di chuyển của nó. Ví dụ, để di chuyển xung quanh chướng ngại vật, xe tự hành có thể sử dụng ML để tính toán không gian trống xung quanh xe, sau đó điều hướng an toàn xung quanh hoặc chuyển làn để vượt xe.
Hợp nhất cảm biến
Mỗi phương thức cảm biến có điểm mạnh và điểm yếu riêng. Ví dụ, với đầu vào trực quan từ camera, bạn sẽ có được kết cấu và màu sắc tốt. Nhưng camera dễ bị ảnh hưởng bởi các điều kiện có thể làm suy yếu đường ngắm và thị lực, giống như mắt người. Vì vậy, sương mù, mưa, tuyết và các điều kiện ánh sáng hoặc sự thay đổi của ánh sáng đều có thể làm giảm nhận thức và do đó, hệ thống của xe sẽ phát hiện, phân đoạn và dự đoán.
Trong khi camera thụ động, radar và LiDAR đều là cảm biến chủ động và chính xác hơn camera ở khoảng cách đo.
Máy học có thể được sử dụng riêng lẻ trên đầu ra từ mỗi phương thức cảm biến để phân loại đối tượng tốt hơn, phát hiện khoảng cách và chuyển động cũng như dự đoán hành động của những người tham gia giao thông khác. Như vậy. Nó có thể nhận đầu ra của camera và đưa ra kết luận về những gì camera đang nhìn thấy. Với radar, tín hiệu và các đám mây điểm đang được sử dụng để tạo ra sự phân cụm tốt hơn, nhằm mang lại hình ảnh 3D chính xác hơn về các vật thể. Tương tự, với LiDAR độ phân giải cao, ML có thể được áp dụng cho dữ liệu LiDAR để phân loại các đối tượng.
Nhưng kết hợp các đầu ra cảm biến là một lựa chọn thậm chí còn mạnh hơn. Camera, radar và LiDAR có thể kết hợp để cung cấp cảm biến 360 độ xung quanh xe. Bằng cách kết hợp tất cả các kết quả đầu ra từ các cảm biến khác nhau, chúng ta sẽ có được bức tranh toàn cảnh hơn về những gì đang diễn ra bên ngoài xe. Và ML có thể được sử dụng ở đây như một bước xử lý bổ sung trên đầu ra hợp nhất từ tất cả các cảm biến này.
Ví dụ, một phân loại ban đầu có thể được thực hiện với hình ảnh camera. Sau đó, nó có thể được kết hợp với đầu ra LiDAR để xác định khoảng cách và tăng cường những gì chiếc xe nhìn thấy hoặc xác thực những gì camera đang phân loại. Sau khi hợp nhất hai đầu ra dữ liệu này, các thuật toán ML khác nhau có thể được chạy trên dữ liệu được hợp nhất. Từ đó, hệ thống có thể đưa ra các kết luận bổ sung hoặc đưa ra các suy luận khác hỗ trợ việc phát hiện, phân đoạn, theo dõi và dự đoán.
Hệ thống truyền động trên xe
Hệ thống truyền động của xe thường tạo ra một chuỗi thời gian các điểm dữ liệu. Máy học có thể được áp dụng cho dữ liệu này để cải thiện khả năng điều khiển động cơ và quản lý pin.
Với ML, một chiếc xe không bị giới hạn bởi các điều kiện biên được thiết lập tại nhà máy và cố định vĩnh viễn. Thay vào đó, hệ thống có thể thích ứng theo thời gian với sự lão hóa của xe và phản ứng với những thay đổi khi chúng xảy ra. ML cho phép điều chỉnh các điều kiện biên khi hệ thống trên xe già đi, khi hệ thống truyền lực thay đổi và khi xe bị hỏng dần. Với sự linh hoạt của các điều kiện biên, xe có thể đạt được vận hành tối ưu hơn.
Hệ thống có thể điều chỉnh theo thời gian, thay đổi các thông số hoạt động của nó. Hoặc, nếu hệ thống có đủ khả năng tính toán, nó có thể thích ứng trong thời gian thực với môi trường thay đổi. Hệ thống có thể học cách phát hiện những điểm bất thường và cung cấp thông báo kịp thời rằng cần phải bảo trì hoặc đưa ra cảnh báo về lỗi điều khiển động cơ sắp xảy ra.
An toàn và An ninh trong Xe tự hành
Điều quan trọng nhất đối với xe tự hành là chúng được vận hành an toàn và không gây ra tai nạn giao thông đường bộ. Điều này liên quan đến sự an toàn chức năng của hệ thống và các thiết bị của xe, cũng như đảm bảo tính bảo mật vốn có của mạng và hệ thống cung cấp năng lượng cho nó.
An toàn chức năng và độ tin cậy của thiết bị
Máy học đóng một vai trò trong việc đảm bảo rằng một chiếc xe vẫn hoạt động tốt bằng cách tránh các lỗi hệ thống có thể gây ra tai nạn.
ML có thể được áp dụng cho dữ liệu được thu thập bởi các thiết bị trên bo mạch. Dữ liệu về các biến số như nhiệt độ động cơ, mức sạc pin, áp suất dầu và mức nước làm mát được gửi đến hệ thống, nơi nó được phân tích và tạo ra bức tranh về hiệu suất của động cơ và sức khỏe tổng thể của xe. Sau đó, các chỉ báo cho thấy một lỗi tiềm ẩn có thể cảnh báo hệ thống và chủ nhân — rằng chiếc xe cần được sửa chữa hoặc bảo dưỡng chủ động.
Tương tự, ML có thể được áp dụng cho dữ liệu thu được từ các thiết bị trong xe, đảm bảo rằng lỗi của chúng không gây ra tai nạn. Các thiết bị như hệ thống cảm biến — camera, LiDAR và radar — cần được bảo trì tối ưu; nếu không, một cuộc hành trình an toàn không thể được đảm bảo.
An ninh
Việc bổ sung các hệ thống máy tính và khả năng kết nối mạng cho các phương tiện giúp an ninh mạng ô tô trở nên tập trung hơn. Tuy nhiên, ML có thể được sử dụng ở đây để tăng cường bảo mật. Đặc biệt, nó có thể được sử dụng để phát hiện các cuộc tấn công và dị thường, sau đó khắc phục chúng.
Một mối đe dọa đối với một chiếc ô tô cá nhân là kẻ tấn công độc hại có thể truy cập vào hệ thống của nó hoặc sử dụng dữ liệu của nó. Các mô hình ML cần phải phát hiện các loại tấn công và bất thường này để xe, hành khách và đường được giữ an toàn.
Phát hiện các cuộc tấn công và sự bất thường
Có thể hệ thống phân loại tự hành trong xe có thể bị tấn công ác ý. Một cuộc tấn công như vậy có thể cố tình làm cho chiếc xe hiểu sai một đối tượng và phân loại nó không chính xác. Loại tấn công này sẽ cần được phát hiện và khắc phục.
Một cuộc tấn công có thể áp đặt sai phân loại cho một phương tiện, như trong trường hợp một biển báo dừng lại được coi là biển báo hạn chế tốc độ. ML có thể được sử dụng để phát hiện các loại tấn công thù địch này và các nhà sản xuất đang bắt đầu phát triển các phương pháp phòng thủ để phá vỡ chúng.
Bằng cách cung cấp các hệ thống mạnh mẽ xung quanh mô hình ML mà các cuộc tấn công như vậy có thể được bảo vệ. Một lần nữa, đào tạo là quan trọng ở đây. Mục đích là tạo ra một cách tổng quát hơn để ADAS đưa ra quyết định của mình. Sử dụng đào tạo để tránh trang bị quá mức tránh phụ thuộc quá nhiều vào một khóa cụ thể — hoặc một tập hợp của chúng. Vì vậy, bởi vì hệ thống có bề rộng kiến thức lớn hơn, đầu vào bị thao túng một cách ác ý sẽ không khiến nó thay đổi sai kết quả hoặc nhận thức.
Mối quan tâm về quyền riêng tư, dữ liệu, và tấn công
Việc ngăn chặn các vụ tấn công trên các mạng được kết nối mà các phương tiện đang chạy là điều tối quan trọng. Trong kịch bản hay nhất, nhiều phương tiện bị tấn công có thể dừng lại và gây ra tắc nghẽn. Nhưng tệ nhất, một cuộc tấn công có thể dẫn đến va chạm nghiêm trọng, bị thương và tử vong.
Hơn 25 bản hack đã được công bố kể từ năm 2015. Trong sự cố lớn nhất cho đến nay, một lỗ hổng phần mềm có thể hack đã khiến Chrysler phải thu hồi 1,4 triệu chiếc xe vào năm 2015. Lỗ hổng này có nghĩa là một hacker có thể chiếm quyền kiểm soát chiếc xe, bao gồm cả hệ thống truyền động, lái và phanh.
Cũng có một thị trường tiềm năng cho dữ liệu do ô tô tạo ra. Dữ liệu có thể được lấy về những người ngồi trên xe, vị trí và chuyển động của họ. Người ta ước tính rằng dữ liệu do ô tô tạo ra có thể trở thành thị trường trị giá 750 tỷ USD vào năm 2030. Mặc dù dữ liệu này tất nhiên được các bên chính hãng quan tâm, như các nhà cung cấp và nhà sản xuất phụ tùng ô tô, nhưng những dữ liệu có giá trị này cũng thu hút tin tặc.
Do đó, việc phát triển các hệ thống nhằm duy trì an ninh mạng trên ô tô tốt hơn là rất quan trọng. Có tới 150 đơn vị điều khiển điện tử (ECU) trên mỗi chiếc ô tô và chúng yêu cầu khoảng 200 triệu dòng mã phần mềm để chạy chúng. Với một hệ thống phức tạp như vậy, tính nhạy cảm và dễ bị tấn công càng cao.
Với ước tính khoảng 470 triệu phương tiện được kết nối trên đường vào năm 2025 chỉ riêng ở châu Âu, Hoa Kỳ và Trung Quốc, giao diện không dây mà chúng sử dụng cần phải an toàn để ngăn chặn các cuộc tấn công hack có thể mở rộng. Những nhà cung cấp hệ thống máy tính cung cấp năng lượng cho xe tự hành phải đảm bảo rằng hệ thống của họ an toàn và không thể thay đổi được.
Riêng tư
Có rất nhiều lo ngại về quyền riêng tư với xe tự hành. Có dữ liệu liên quan đến người lái xe và gia đình hoặc những người khác sử dụng xe. Với tính năng điều hướng, một số thông tin GPS nhất định sẽ cho phép theo dõi ô tô hoặc ghi lại lịch sử hành trình của nó. Nếu một camera hướng trong cabin đang được sử dụng để giám sát tài xế, thông tin cá nhân sẽ được thu thập về từng người ngồi trên xe, bao gồm họ đã đi đâu, đi cùng ai và khi nào. Các dữ liệu khác từ bên ngoài xe cũng có thể được thu thập. Điều này có thể ảnh hưởng đến những người tham gia giao thông khác bên ngoài phương tiện, những người không biết rằng họ có thể nhận ra hoặc dữ liệu về họ đang được thu thập.
Với tất cả những điều này, những lo ngại có thể hiểu được nảy sinh về việc thu thập dữ liệu được quy định để nó được xử lý hợp pháp và chính xác. Và hơn thế nữa, một lần nữa có nguy cơ bảo mật là dữ liệu có thể vô tình bị rò rỉ hoặc thậm chí bị chặn, có nghĩa là dữ liệu có thể được truy cập và sử dụng mà không áp dụng các biện pháp bảo vệ pháp lý.
Dữ liệu cũng có giá trị theo cách cạnh tranh. Khi chiếc xe đang lái, dữ liệu liên tục được thu thập về những gì nó đang nhìn thấy, phương pháp phân loại được ADAS sử dụng, kết luận cuối cùng của nó, v.v. Nếu điều này được truy cập, nó có thể được thiết kế đảo ngược để trích xuất thông tin và sao chép nó sang môi trường khác.
Có nhiều nỗ lực trong ngành nhằm đảm bảo các mô hình thực tế được bắt nguồn từ học máy. Cụ thể, những thứ xác định cách hệ thống phân loại những gì nó cảm nhận, cách nó hoạt động với tốc độ nó đang di chuyển và nó sẽ di chuyển theo hướng nào tiếp theo.
Học máy có thể thay thế các thuật toán thị giác truyền thống không?
Học máy có thể được sử dụng để thay thế cho các thuật toán thị giác máy tính truyền thống, giúp nó hữu ích trong các phương tiện tự hành để phát hiện, phân loại, phân đoạn, theo dõi và dự đoán đối tượng. Làm điều này sẽ ảnh hưởng đến mức độ xác định, an toàn và bảo mật của hệ thống.
Trong các phương pháp xác định hơn, chẳng hạn như phương pháp dựa trên thực tế hoặc thị giác máy tính truyền thống, kỹ sư hoặc nhà khoa học máy tính phát triển thuật toán thị giác xác định các tham số chính cần thiết để đưa ra quyết định. Nhưng trong ML, thuật toán tự nó chọn các tiêu chí mà nó cho là quan trọng nhất để nó đưa ra quyết định đúng.
Vì vậy, chất lượng của dữ liệu đào tạo là cực kỳ quan trọng ở đây. Việc xác thực cách thức và lý do tại sao một quyết định được đưa ra đôi khi có thể khó khăn, và không phải lúc nào cũng rõ ràng điều gì chính xác dẫn đến quyết định của hệ thống ML.
Với thị giác máy tính truyền thống, các tiêu chí quan trọng được xác định trước. Vì vậy, ví dụ, người ta biết tại sao một hệ thống xác định một đối tượng là người đi bộ. Chất lượng của tập dữ liệu trở nên cực kỳ quan trọng nếu hệ thống chỉ được chỉ định với dữ liệu cho biết “đây là người đi bộ”.
Với ML, chúng ta không thể xác định xem hệ thống có thực sự xem xét các tiêu chí giống như trước đây trong một thuật toán truyền thống hay không, hay liệu hệ thống có phát triển bộ tiêu chí của riêng mình hay không. Làm cách nào sau đó suy đoán được sử dụng có thể bị trùng lặp hoặc lặp lại không? Thường có một đánh giá độ chính xác hoặc độ tin cậy đối với việc ra quyết định của các thuật toán ML. Và với phân loại, chẳng hạn, hệ thống có thể chắc chắn 90% rằng một đối tượng là người đi bộ và có thể chắc chắn 10% rằng đó là một cột đèn.
Huấn luyện bổ sung có thể nâng cao độ chắc chắn đó lên đến 92% hoặc 93%, nhưng có thể không bao giờ đạt được 100%. Tuy nhiên, khi điều này được áp dụng cho các ứng dụng quan trọng về an toàn như lái xe tự hành, thì sẽ không có chỗ cho lỗi phân loại, Hệ thống cần chắc chắn 100% rằng một thứ gì đó được phân loại chính xác, để đảm bảo rằng thứ mà nó được coi là một vật vô tri vô giác sẽ không bước lên phía trước xe.
Lợi ích của việc sử dụng ML để phát hiện và phân loại đối tượng
Mặc dù nó có thể không chính xác hơn các hệ thống dựa trên thị giác, nhưng theo thời gian, các thuật toán ML có thể đạt được mức độ chính xác cao hơn. Các hệ thống khác cuối cùng đạt đến mức ổn định ở một mức nhất định, vì chúng không thể đạt được độ chính xác cao hơn nữa. Nhưng với ML, khi áp dụng nhiều khóa đào tạo hơn, và đào tạo nghiêm ngặt hơn — cũng như nâng cao dần và cải tiến mô hình — có thể đạt được mức độ chính xác cao hơn.
Học máy cũng có khả năng thích ứng và mở rộng cao hơn so với các hệ thống thị giác. Bởi vì hệ thống ML tạo ra các quy tắc riêng và phát triển dựa trên đào tạo, thay vì đầu vào của kỹ sư, nên nó có thể được mở rộng và áp dụng cho các tình huống khác. Một cách hiệu quả, hệ thống thích ứng với các địa điểm hoặc cảnh quan mới bằng cách áp dụng kiến thức đã học.
Sự dễ dàng mà các nền tảng ML có thể xác định xu hướng cũng là một điểm cộng. Chúng có thể nhanh chóng xử lý khối lượng lớn dữ liệu và dễ dàng phát hiện ra các xu hướng và mô hình có thể không quá rõ ràng đối với một người đang xem qua cùng một thông tin. Các thuật toán được sử dụng trong xe tự hành cần phải áp dụng lặp đi lặp lại cùng loại dữ liệu này. Vì vậy, đó là một lợi thế khi có một hệ thống có thể thực hiện việc đó một cách nhanh chóng và hiệu quả cao.
Các thuật toán ML có thể thích ứng và phát triển mà không cần con người. Hệ thống có thể xác định và phân loại các đối tượng mới và điều chỉnh phản ứng của xe đối với chúng, thậm chí là tự động mà không cần bất kỳ sự can thiệp hoặc chỉnh sửa nào của con người. Một lần nữa, cần phải đào tạo sâu và rộng để hệ thống hướng xe phản ứng thích hợp, nhưng đây là một quá trình tương đối đơn giản.
Sử dụng phương pháp ML tránh phụ thuộc vào hành vi xác định. Điều đó có nghĩa là, không thể luôn luôn nhập các giá trị giống nhau theo cùng một cách – không phải tất cả các ô tô đều giống nhau, nhưng chúng vẫn là ô tô – nhưng bất kỳ hệ thống tự hành nào cũng cần xác định ô tô là ô tô, bất chấp sự khác biệt của chúng. Nó cần tạo ra kết quả hoàn toàn có thể dự đoán được, mặc dù đầu vào không nhất quán. Một chiếc xe tự hành cần có khả năng hoạt động trong thế giới thực, nơi có những sự khác biệt, không chắc chắn và tính mới.
Hạn chế của Học máy đối với Phát hiện và Phân loại Đối tượng
Một trong những hạn chế của việc sử dụng ML để phát hiện và phân loại đối tượng là yêu cầu các bộ dữ liệu khổng lồ. Và không chỉ vậy, như đã thảo luận trước đây, các hệ thống cần được huấn luyện với nhiều tình huống khác nhau, để không có sự sai lệch trong dữ liệu. Dữ liệu sai lệch sẽ không thể hiện các kết quả thực như cuộc sống, vì vậy một chiếc ô tô có thể phản ứng với một tình huống hoàn toàn khác — và có thể là nguy hiểm — đối với cách trí thông minh của con người sẽ giải thích nó.
Để được đào tạo đủ để tránh sai lệch dữ liệu như vậy cần thời gian và lượng tài nguyên xử lý máy tính khổng lồ. Và cũng có thời gian cần thiết để xác nhận và kiểm tra xem khóa đào tạo có hoạt động hay không và ADAS đang hoạt động như mong đợi đối với các tình huống khác nhau mà chương trình này đưa ra.
Một khía cạnh của việc lái xe mà ML có thể không đối phó được là khi phải nhận ra những người tham gia giao thông khác. Con người đã quen với việc giao tiếp bằng mắt để nhận biết người đi bộ đang bắt đầu băng qua đường hoặc ra hiệu cho một chiếc xe khác để kéo phía trước. Nhưng không rõ bằng cách nào mà điều này có thể được sao chép bởi một hệ thống tự hành, và do đó được đào tạo, sử dụng ML. Cho đến khi vấn đề đó được giải quyết, và cho đến khi các hệ thống có thể tiến gần hơn đến trí tuệ cảm xúc của con người và những dự đoán tức thời của con người cần thiết để đối phó với những loại tình huống này, điều đó có thể không bao giờ khả thi trong các phương tiện tự hành.
Học máy cũng bị hạn chế khi dạy một hệ thống cách phản ứng với thứ mà con người bẩm sinh đã có. Ví dụ, “giác quan thứ sáu” cho thấy một chiếc xe hơi có thể sắp lao tới trước mặt bạn, hoặc một chiếc xe tải có thể đột ngột phanh gấp.
Để cho một bộ máy chịu trách nhiệm về các quyết định của chính nó là một tiền đề khó khăn đối với nhiều người. Tính xác định của một hệ thống là điều mà nhiều người – có lẽ ngoại trừ các nhà khoa học máy tính – thấy có vấn đề. Một số người nghi ngờ rằng “máy móc sẽ tiếp quản” và niềm tin của họ vào phương tiện tự lái là thấp. Bất chấp những dự đoán rằng sẽ có ít tai nạn và tử vong hơn với xe tự hành, niềm tin bị tổn hại hơn nữa do các sự cố trong quá trình thử nghiệm — như chiếc xe tự lái của Uber đã lao qua và giết chết một người đi bộ ở Arizona hoặc người lái xe tự động Tesla bị tai nạn khi chơi game.
Một hệ thống hoàn toàn tự hành, là hệ thống ở Cấp độ 5, sẽ yêu cầu sự an toàn về chức năng hoàn hảo, điều này không dễ đảm bảo chỉ sử dụng máy học. Với số lượng và phương thức đào tạo được yêu cầu, cộng thêm khó khăn trong việc tái tạo trí thông minh của con người, các hệ thống vẫn chưa đủ khả năng để phát hiện và phân loại chính xác các đối tượng.
Phương pháp tiếp cận dựa trên máy học có phải là phương pháp phù hợp?
Mặc dù có một số hạn chế, nhưng lợi ích của việc sử dụng ML để phát hiện và phân loại đối tượng là rất mạnh. Không bắt buộc các yếu tố mô hình hóa và cảm nhận của một chiếc xe hoàn toàn tự động phải đạt được ở mức cao nhất, giống như những yếu tố được nêu trong ASIL D (Automotive Safety Integrity Level D – Tính toàn vẹn về an toàn ô tô cấp độ D). Ở cấp độ ASIL D, hệ thống phải luôn sẵn sàng hoạt động. Điều này thường đạt được nhờ tính năng dự phòng tích hợp cũng như sự giám sát và kỷ luật chặt chẽ hơn trong chính quá trình phát triển.
Đạt được cấp độ ASIL D rất khó và tốn kém. Có một kỳ vọng ban đầu rằng mọi thứ trong một chiếc ô tô tự hành liên quan đến việc truyền động sẽ phải đạt được mức độ kiểm soát quy trình và chất lượng ô tô cao nhất này. Nhưng có nhiều cách để đạt được tính khả dụng của hệ thống và sự an toàn mà không cần đến các yêu cầu ASIL D đối với mọi thành phần trong chuỗi, đặc biệt khi nói đến các yếu tố mô hình hóa và nhận thức.
Ví dụ: với nhiều cảm biến như camera, LiDAR và radar, có một mức độ trùng lặp trong các trường nhận thức. Điều này cung cấp một số dự phòng và bảo mật. Ví dụ, nếu camera bị lỗi, thì LiDAR hoặc radar sẽ cung cấp đủ trường “quan sát” giống nhau để giữa chúng, các phương thức cảm biến này có thể mang lại một mức độ dự phòng nhất định. Do đó, trong việc thiết kế các hệ thống mô hình hóa và cảm nhận của chúng, các công ty có thể gắn bó với các hệ thống không yêu cầu thiết bị ASIL D, nhưng vẫn cung cấp một mô hình tốt về thế giới xung quanh chiếc xe.
Các xu hướng tương lai về học máy cho xe tự hành
Các công ty công nghệ lớn và các nhà sản xuất ô tô chính đều đang cạnh tranh để phát triển các dịch vụ xe tự hành của họ. Mỗi thương hiệu đều muốn trở thành người đầu tiên tiếp thị để thống trị lĩnh vực này. Hiện tại, có rất nhiều hoạt động với sự phát triển của cơ sở hạ tầng kết nối, sự xuất hiện của công nghệ 5G, tiến tới việc tạo ra luật mới để điều chỉnh ngành và thậm chí là hướng tới tính di động như một dịch vụ (MaaS – mobility as a service).
Ngoài ra còn có những thay đổi về cách học máy đang được sử dụng. Đây là những xu hướng trong tương lai mà chúng ta tin rằng sẽ thúc đẩy thị trường xe tự hành.
Radar hình ảnh
Radar hình ảnh là loại radar có độ phân giải cao, vừa có thể phát hiện và phân loại đối tượng. Ngoài các khả năng cơ bản của radar, radar hình ảnh cũng cung cấp mật độ lớn hơn ở các điểm phản xạ mà nó thu thập. Vì vậy, nó không chỉ phát hiện một đối tượng và xác định vị trí gần của nó, mà còn sử dụng tập hợp tất cả các điểm để bắt đầu tạo đường viền của các đối tượng mà nó đang thu thập. Từ những phác thảo đó, có thể bắt đầu đưa ra quyết định về phân loại đối tượng được phản ánh.
Radar hình ảnh có chi phí phát triển tương đối thấp. Và đối với một cảm biến tận dụng tất cả các lợi ích của radar trong việc phát hiện và khoảng cách, cũng như mang lại khả năng phân loại, đó là một xu hướng thú vị cho tương lai, thậm chí có thể cho phép phụ thuộc vào radar nhiều hơn LiDAR.
Hiệu suất tính toán
Đào tạo là khía cạnh cốt lõi của học máy. Để đạt được bất kỳ nơi nào gần với khả năng của con người và tránh nguy cơ dị thường, việc đào tạo yêu cầu hệ thống tiếp xúc nhiều lần với các tình huống đa dạng và ít phổ biến xảy ra trên đường đô thị, đường cao tốc và xa lộ.
Khi ngày càng nhiều dặm đường được thu thập bởi các nhà sản xuất xe hơi, và nhiều đối tượng cần phát hiện và phân loại, các bộ dữ liệu được tạo ra ngày càng gia tăng.
Sự phát triển của các tập dữ liệu này đưa ra một thách thức: yêu cầu có đủ hiệu suất tính toán để triển khai các mạng được đào tạo đó. Do đó, một sự đổi mới đang nổi lên là việc tạo ra các kỹ thuật tăng tốc được tối ưu hóa cao. Các bước phát triển trong xử lý thông tin đã có những tiến bộ vượt bậc, chẳng hạn như triển khai các mạng được đào tạo trực tiếp lên các mạch tích hợp. Những con chip mới này cho phép triển khai các mạng phức tạp với chi phí thấp và công suất thấp. Các giải pháp silicon tiết kiệm diện tích và tối ưu hóa chi phí như thế này sẽ có thể thúc đẩy thị trường tiến lên và khắc phục các vấn đề về hiệu suất tính toán.
LiDAR
Một xu hướng mới nổi khác trong học máy cho thị trường ô tô là chuyển giao các kỹ thuật hiện đang được triển khai để phân loại và phát hiện dựa trên camera sang mạng LiDAR. Vì vậy, thay vì sử dụng khung ảnh hai chiều để xác định và phân loại đối tượng, có thể sử dụng dữ liệu ba chiều thu được từ phản xạ LiDAR và sau đó triển khai các mạng được đào tạo trên thông tin đó. Bằng cách này, hệ thống có thể xác định các khía cạnh như nơi con đường bắt đầu và kết thúc; vị trí của các điểm giao nhau; hoặc vị trí đèn giao thông.
Điều này có thể thực hiện được bằng cách sử dụng mạng nơ ron phức hợp (convolutional neural networks – CNN), một lớp học sâu. Các công ty đã và đang làm việc trên công nghệ này – với thành công – và đó là một lĩnh vực cho thấy nhiều hứa hẹn.
Bộ vi điều khiển được tích hợp đầy đủ
Các bộ vi điều khiển (MCU) được tích hợp đầy đủ sẽ cho phép thế hệ xe tự hành tiếp theo. Ở Cấp độ 5, MCU sẽ cho phép xe phát hiện lỗi, sau đó tự động đưa xe dừng lại một cách an toàn mà không cần bất kỳ sự can thiệp nào từ người lái.
MCU hiện tại có nguồn gốc từ đồ họa hoặc từ máy tính để bàn và máy tính doanh nghiệp. Chúng không phải là các giải pháp được thiết kế đặc biệt cho các ứng dụng ô tô — và không đủ mạnh. Do đó, chúng được sử dụng cùng với một bộ xử lý hiệu suất cao, riêng biệt. MCU nằm bên cạnh bộ xử lý và giao tiếp với xe. Điều này cung cấp cho hệ thống giao diện trực tiếp cần thiết để liên lạc an toàn với xe.
MCU có thể tự kiểm tra an toàn trên mạch tích hợp hiệu suất cao, với các chẩn đoán đảm bảo hệ thống trên chip (SoC) hoạt động tốt và tối ưu. MCU hoạt động như một bộ xử lý cốt lõi để khắc phục những khiếm khuyết cố hữu thậm chí còn nằm trong các bộ xử lý hiệu suất cao, trong đó chúng không được thiết kế cho môi trường ô tô.
Một xu hướng ở đây là tích hợp khả năng MCU vào bộ xử lý để cung cấp giải pháp chip đơn. Do đó, chức năng MCU sẽ được các nhà sản xuất nhúng trực tiếp vào chip. Bằng cách này, các sản phẩm được thiết kế đặc biệt để đáp ứng nhu cầu xử lý cao hơn của phương tiện tự lái. Điều này không cần thiết phải có chip riêng, tiết kiệm chi phí đồng thời cải thiện chất lượng và khả năng của bộ xử lý.
Tương lai của Học máy và Xe tự hành
Vậy, học máy sẽ định hình ngành công nghiệp xe tự hành như thế nào trong tương lai? Và khi nào chúng ta sẽ thấy các phương tiện tự hành hoàn toàn trên đường?
Không có khả năng có thể mong đợi các mô hình sản xuất quy mô lớn của xe tự hành trước năm 2025 và xe Cấp độ 5 trước năm 2035. Ngoài ra, vẫn còn phải chờ xem có thể mất bao lâu nữa trước khi số lượng xe không người lái vượt xa những chiếc xe được điều khiển bằng tay.
Tuy nhiên, xe không người lái chắc chắn đang xảy ra và sắp đến đích. Nhờ ML, những chiếc xe này được thiết lập để mang lại khả năng di chuyển cao hơn cho hàng triệu người khiếm thị và người tàn tật; cho phép giao hàng ở các khu vực xa hơn, đưa hàng hóa đến tay mọi người nhanh hơn, tiết kiệm chi phí hơn và kết nối cộng đồng; và hơn bất cứ điều gì, cải thiện an toàn đường bộ, giảm sự cố giao thông đường bộ, thương tích và tử vong.
Nhưng để biến đổi cuộc sống của chúng ta theo hướng tốt đẹp, một số yếu tố vẫn cần kết hợp với nhau. Các nhà sản xuất ô tô sẽ phải làm phần việc của họ để đảm bảo sự an toàn, độ tin cậy và khả năng tồn tại của những chiếc xe này. Tất nhiên, họ muốn hoàn vốn đầu tư vào nghiên cứu và phát triển, nhưng họ sẽ cần phải chứng minh tính an toàn và bảo mật của phương tiện không người lái trước khi người tiêu dùng sẵn sàng chấp nhận chúng.
Các chính phủ cũng có một phần vai trò. Họ sẽ cần phải lập pháp luật về quyền tự chủ của các phương tiện và việc không có người lái xe. Chắc chắn rằng các quốc gia khác nhau sẽ có những cách tiếp cận khác nhau đối với vấn đề này. Và ngay cả trong các quốc gia, các cơ quan lập pháp khác nhau — ví dụ, ở Hoa Kỳ — có thể nhìn nhận mọi thứ khác nhau. Sự hợp tác và cộng tác ở đây sẽ là một chặng đường dài hướng tới việc giúp ngành công nghiệp cung cấp các phương tiện được tiêu chuẩn hóa với các tính năng tương tự hoặc giống hệt nhau.
Các chính phủ cũng có thể giúp khuyến khích việc sử dụng các phương tiện tự hành bằng các biện pháp khuyến khích. Cũng giống như cách mà nhiều cơ quan lập pháp đã khuyến khích việc sử dụng ô tô điện, hoặc những loại xe ít gây hại cho môi trường, các ưu đãi thuế có thể thúc đẩy việc sử dụng các phương tiện tự hành. Điều này sẽ có lợi cho các quốc gia làm điều này vì phần thưởng sẽ ít tai nạn hơn và ít áp lực hơn đối với việc chăm sóc sức khỏe. Tương tự, chúng ta có thể thấy các công ty bảo hiểm đưa ra mức phí bảo hiểm thấp hơn cho các phương tiện không người lái, có thể ở mức giảm theo mức độ tự hành.
Cuối cùng, hợp tác là chìa khóa. Mỗi công ty khác nhau đều có chuyên môn trong các lĩnh vực riêng của họ liên quan đến học máy. Một số chuyên về cảm nhận dựa trên camera hoặc xử lý LiDAR; những công ty khác đã đầu tư vào đầu vào cảm biến tổng hợp; và vẫn còn những công ty khác có chuyên môn về các quyết định tìm đường và lập kế hoạch quỹ đạo và chuyển các quyết định đó thành một hành động thú vị khi lái, tăng tốc và giảm tốc. Các công ty này sẽ cần hợp tác để giúp các nhà sản xuất ô tô đưa các thiết kế xe tự hành của họ vào sản xuất.
Ali Osman Ors