Báo cáo đánh giá lần thứ sáu được công bố gần đây của Ủy ban liên chính phủ về biến đổi khí hậu (IPCC) đã tóm tắt những hiểu biết hiện tại về khoa học khí hậu một cách chi tiết chưa từng có.
Bằng chứng sâu rộng đưa vào báo cáo bao gồm các quan sát được thu thập từ khắp đất liền, đại dương và khí quyển, cũng như nhiều mô phỏng từ thế hệ mô hình khí hậu mới nhất.
Tuy nhiên, trong những năm gần đây, các nhà khoa học khí hậu đã có sẵn một công cụ khác nhờ những tiến bộ nhanh chóng trong việc phát triển trí tuệ nhân tạo (AI) và đặc biệt là học máy. Ngược lại với các mô hình tuân theo một tập hợp các quy tắc rõ ràng và được xác định trước, học máy hướng tới việc xây dựng các hệ thống có thể học và suy ra các quy tắc đó dựa trên các mẫu trong dữ liệu.
Kết quả là, một hướng nghiên cứu khí hậu mới đang xuất hiện nhằm mục đích bổ sung và mở rộng việc sử dụng các quan sát và mô hình khí hậu. Mục tiêu tổng thể là giải quyết những thách thức dai dẳng trong nghiên cứu khí hậu và cải thiện các dự báo cho tương lai.
Trong bài viết quan điểm của chúng tôi, được xuất bản trên tạp chí Nature Machine Intelligence, chúng tôi đánh giá những hạn chế hiện tại và những tiến bộ gần đây của các mô hình khí hậu và phương pháp học máy trong khoa học hệ thống Trái đất.
Chúng tôi đề xuất một cách tiếp cận trong đó các mô hình khí hậu và học máy không được sử dụng như các công cụ riêng lẻ mà là các “con lai” được kết nối có khả năng tiến hóa thích ứng và tự xác nhận, trong khi vẫn có thể được con người giải thích.
mô hình hệ thống trái đất
Các mô hình khí hậu đã chứng kiến sự cải tiến liên tục trong những thập kỷ gần đây. Những phát triển gần đây nhất đã chứng kiến sự kết hợp của các chu trình sinh địa hóa – sự chuyển giao hóa chất giữa các sinh vật sống và môi trường của chúng – và cách chúng tương tác với hệ thống khí hậu, giống như các mô hình trước đó, các “mô hình hệ thống Trái đất” (ESM) này được sử dụng để thực hiện. dự báo khí hậu trong tương lai theo các kịch bản khác nhau về phát thải khí nhà kính.
Tuy nhiên, trong khi việc bổ sung các quy trình mới và chi tiết hơn đã dẫn đến những mô phỏng phức tạp hơn về khí hậu Trái đất, nó lại phải trả giá bằng những mô hình ngày càng lớn và phức tạp.
ESM được xây dựng dựa trên các phương trình thể hiện các quá trình và tương tác thúc đẩy khí hậu Trái đất. Một số quá trình này có thể được mô tả bằng các định luật cơ bản – chẳng hạn như phương trình Navier-Stokes về chuyển động của chất lỏng, mô tả tốc độ, áp suất, nhiệt độ và mật độ của các chất khí trong khí quyển và nước trong đại dương. Tuy nhiên, những vấn đề khác – chẳng hạn như các quá trình sinh lý chi phối thảm thực vật bao phủ phần lớn bề mặt đất – không thể và thay vào đó đòi hỏi những ước tính gần đúng dựa trên các quan sát.
Những phép tính gần đúng này – cũng như những hạn chế khác xuất phát từ sự phức tạp tuyệt đối của hệ thống Trái đất – đưa đến sự không chắc chắn trong cách thể hiện khí hậu của mô hình.
Kết quả là, bất chấp sự thành công to lớn của ESM, vẫn còn một số hạn chế – chẳng hạn như mức độ mô hình nắm bắt được mức độ nghiêm trọng và tần suất của các sự kiện cực đoan cũng như những thay đổi đột ngột và “điểm tới hạn”.
Học máy cho nghiên cứu khí hậu
Học máy là một thuật ngữ bao quát cho nhiều công cụ khác nhau, trong đó mạng lưới thần kinh nhân tạo – một tập hợp các thuật toán kết nối với nhau được mô hình hóa lỏng lẻo trên não người – là một ví dụ được biết đến và sử dụng rộng rãi.
Thông qua “học có giám sát” – sử dụng bộ dữ liệu để “huấn luyện” thuật toán – những công cụ này có thể được sử dụng để khám phá các mẫu và mối quan hệ phức tạp giữa các biến, cho phép chúng thực hiện các nhiệm vụ cụ thể như phân loại hoặc phân tích dữ liệu.
Ví dụ: mạng lưới thần kinh có thể được đào tạo để xác định và phân loại các mẫu trong hình ảnh vệ tinh – chẳng hạn như cấu trúc đám mây, xoáy nước đại dương hoặc chất lượng cây trồng – cũng như thực hiện dự báo thời tiết dựa trên các bản ghi trong quá khứ, kết quả đầu ra của mô hình và phương trình cân bằng vật lý.
Ngược lại với ESM, học máy không yêu cầu kiến thức trước về các luật điều chỉnh và các mối quan hệ trong một vấn đề. Các mối quan hệ tương ứng được lấy hoàn toàn từ dữ liệu được sử dụng trong quá trình học tập tự động. Khái niệm linh hoạt và mạnh mẽ này có thể được mở rộng đến hầu hết mọi mức độ phức tạp.
Sự sẵn có của dữ liệu khí hậu được quan sát và mô phỏng mô hình kết hợp với các công cụ học máy sẵn sàng sử dụng – như TensorFlow và Keras – đã dẫn đến sự bùng nổ của các nghiên cứu học máy trong khoa học Trái đất và khí hậu. Những điều này đã khám phá cách học máy có thể được áp dụng để nâng cao hoặc thậm chí thay thế các tác vụ ESM cổ điển.
Bất chấp những từ như “học tập” và “trí tuệ nhân tạo”, các ứng dụng học máy ngày nay trong lĩnh vực này còn lâu mới thông minh và thiếu kiến thức về quy trình thực tế. Chính xác hơn, chúng là những thuật toán có tính chuyên môn cao được đào tạo để giải quyết các vấn đề rất cụ thể chỉ dựa trên dữ liệu được trình bày liên quan đến vấn đề.
Do đó, học máy thường được coi là một hộp đen khiến việc thu thập thông tin chi tiết trở nên khó khăn. Tương tự, thường rất khó để xác thực việc học máy về tính nhất quán về mặt vật lý, ngay cả khi kết quả đầu ra được tạo ra của chúng có vẻ hợp lý.
Nhiều ứng dụng học máy ngày nay dành cho khoa học khí hậu là các nghiên cứu chứng minh khái niệm hoạt động trong môi trường đơn giản hóa – ví dụ: với độ phân giải không gian thấp hơn nhiều so với ESM hiện đại hoặc với số lượng ít hơn. các biến vật lý. Vì vậy, vẫn còn phải xem máy học có thể được mở rộng tốt như thế nào để phù hợp với mức độ sử dụng đáng tin cậy và hoạt động.
Hướng tới mô hình hóa hệ thống trái đất thần kinh
Ban đầu, học máy trong nghiên cứu khí hậu chủ yếu được sử dụng để phân tích tự động các mô hình và mối quan hệ trong các quan sát Trái đất. Tuy nhiên, gần đây, nó ngày càng được nhắm tới các ESM – ví dụ: bằng cách tiếp quản hoặc sửa các thành phần mô hình cụ thể hoặc bằng cách tăng tốc các mô phỏng số đòi hỏi tính toán.
Sự phát triển này đã dẫn đến khái niệm “kết hợp” giữa ESM và học máy, nhằm mục đích kết hợp các ưu điểm về phương pháp tương ứng trong khi giảm thiểu những hạn chế của chúng. Ví dụ, khái niệm lai đã được khám phá để phân tích thủy văn lục địa.
Việc tiếp tục hướng nghiên cứu này sẽ ngày càng kết hợp ranh giới chặt chẽ cho đến nay giữa các mô hình dựa trên quy trình và phương pháp học máy.
Theo cách tương tự như cách các mô hình khí hậu “kết hợp” liên kết các phần khác nhau của hệ thống Trái đất – chẳng hạn như đại dương và khí quyển – các giao diện mới sẽ thiết lập sự trao đổi thông tin năng động giữa ESM và các công cụ học máy. Việc trao đổi hai chiều này cho phép các mô hình dựa trên quy trình cải thiện tính nhất quán về mặt vật lý của chúng và từ đó phản hồi kiến thức cho thành phần học máy, cho phép toàn bộ hệ thống lai liên tục phát triển.
Các biến thể có thể có của các hệ thống lai như vậy được tóm tắt dưới thuật ngữ – mà chúng tôi đã đặt ra – là “mô hình hóa hệ thống thần kinh Trái đất”. Điều này được minh họa trong hình bên dưới, cho thấy các giai đoạn về cách ESM (màu xanh lam) và máy học (màu vàng) có thể kết hợp với nhau.

Chúng tôi cũng đã phác thảo một tập hợp các đặc điểm và mục tiêu cho mô hình hóa hệ thống thần kinh Trái đất:
- Các giống lai đảm bảo tính nhất quán về mặt vật lý – ví dụ, các định luật bảo toàn và các phương trình cân bằng khác;
- Rằng các giống lai có thể tái tạo và dự đoán tốt hơn các mẫu ngoài phân phối, chẳng hạn như các sự kiện cực đoan;
- Rằng con lai có thể tự sửa chữa, cải thiện và khẳng định mình;
- Mô hình hệ thống Trái đất thần kinh đó cho phép khả năng nhân rộng và khả năng diễn giải.
Có thể giải thích và giải thích được
Khi chúng tôi cố gắng cải thiện ESM, có một nguy cơ là mọi thứ bắt đầu giống như một chiếc đinh bị búa học máy mới đập vào. Ở đây, các phương pháp được gọi là “AI có thể giải thích được” (IAI) và “AI có thể giải thích được” (XAI) đang được áp dụng.
Trong học máy, việc đưa ra dự đoán chính xác vì những lý do sai lầm có thể được gọi là “đi tắt” hoặc có mô tả hệ thống “chưa được xác định”. Việc đi đường tắt ngày càng có khả năng xảy ra trong khoa học khí hậu vì dữ liệu có sẵn cho chúng tôi từ hồ sơ quan sát rất ngắn và thiên về những thập kỷ gần đây.
Với tư cách là một cộng đồng, chúng tôi vẫn chỉ đang tìm hiểu những lợi ích tiềm năng của học máy cũng như tìm hiểu về những cạm bẫy không thể tránh khỏi. Điều rất rõ ràng là học máy có thể cho chúng ta những câu trả lời có vẻ đúng nhưng lại hoàn toàn sai lầm.
IAI tập trung vào việc xây dựng các mô hình có thể hiểu được bằng trực giác, trong khi XAI được sử dụng để đánh giá hồi cứu lý do tại sao mạng lưới thần kinh lại đưa ra dự đoán như vậy. Cả IAI và XAI đều tự cho mình khả năng cung cấp cho bất kỳ ứng dụng học máy nào trong ESM một “kiểm tra độ tỉnh táo” để xem liệu ứng dụng đó có học được gì về mặt vật lý hay không. Điều này rất quan trọng, vì – theo định nghĩa – bất kỳ ứng dụng nào để đánh giá khí hậu trong tương lai đều hoạt động trong một không gian ngoài mẫu, trong đó các định luật vật lý cốt lõi sẽ không thay đổi, nhưng cách hệ thống thể hiện chúng thì có thể sẽ thay đổi.
Các phương pháp học máy đang phát triển rất nhanh, IAI và XAI cũng không ngoại lệ. Các phương pháp khác dường như có tiềm năng là học đối nghịch (nhằm đánh lừa hệ thống học máy bằng thông tin đầu vào sai lệch) và phương pháp “chụp vài phát” (nhằm đào tạo hiệu quả hệ thống học máy chỉ với một lượng nhỏ dữ liệu) và các phương pháp tổng thể được nhắm mục tiêu nhiều hơn trong việc học các phương trình cơ bản.
Trong khi cộng đồng xung quanh ESM khám phá các công cụ học máy mới và tiềm năng mạnh mẽ bên trong chúng, chắc chắn sẽ đẩy nhanh tiến độ nếu các công cụ khác nhau được công nhận như vậy – mỗi công cụ có thể phù hợp cho các nhiệm vụ khác nhau. Tuy nhiên, việc đảm bảo rằng các dự đoán của máy học tuân thủ các cơ chế hoặc vật lý đã biết cũng tương đương với việc xây dựng các công cụ cần thiết mà ESM mong muốn có được.
Irrgang, C. và cộng sự. (2021) Hướng tới mô hình hóa hệ thống thần kinh Trái đất bằng cách tích hợp trí tuệ nhân tạo vào khoa học hệ thống Trái đất, Trí tuệ máy tự nhiên, doi:10.1038/s42256-021-00374-3
Những chia sẻ từ câu chuyện này