Tổng quan về cuốn sách “Khoa học dữ liệu, trí tuệ nhân tạo và học máy trong phát triển thuốc”

Tổng quan về cuốn sách Khoa học dữ liệu, trí tuệ nhân tạo và học máy trong phát triển thuốc

  • Sách được biên tập bởi Tiến sĩ Harry Yang – người có kinh nghiệm trong lĩnh vực dữ liệu sinh học, dược phẩm, từ khám phá mục tiêu của thuốc (target discovery) tới nghiên cứu lâm sàng & hậu phê duyệt.  
  • Sách dày 484 trang, gồm nhiều chương, mỗi chương nói về một khía cạnh cụ thể của R&D thuốc với Khoa học dữ liệu / trí tuệ nhân tạo (AI) / học máy (ML). 

Ưu điểm của sách

  1. Tổng quan sâu và rộng 

Sách bao quát gần hết các giai đoạn phát triển thuốc: từ khám phá ban đầu, sàng lọc phân tử, thử nghiệm lâm sàng, an toàn/cảnh giác dược, cho đến sản xuất và chuỗi cung ứng.  

  1. Thực tế & nhiều ví dụ

Sách có nhiều ví dụ thực tiễn về ứng dụng AI/ML để giải quyết các vấn đề cụ thể trong quá trình phát triển thuốc. Điều này rất hữu ích để hiểu cách áp dụng lý thuyết vào thực hành.  

  1. Chương về khía cạnh pháp lý / quy chế 

Đây là một phần quan trọng vì việc đưa AI/ML vào phát triển thuốc không chỉ về là kỹ thuật mà còn về khuôn khổ pháp lý, đạo đức, tuân thủ quy định. Cuốn sách này dành hẳn một chương để bàn về sự phát triển quy chế.  

  1. Phù hợp với người mới lẫn người đã có kinh nghiệm

Những người chưa làm nhiều về khoa học dữ liệu/AI vẫn có thể theo kịp; sách cũng cung cấp những phần dễ tiếp cận, giải thích rõ vấn đề và cách thức triển khai. Còn với người có kinh nghiệm thì có các chương chuyên sâu hơn.  

  1. Tập trung vào việc xây tổ chức dữ liệu/AI

Có chương về cách xây dựng tổ chức khoa học dữ liệu (data science organization) linh hoạt, có thể mở rộng – điều rất thực tế nếu một công ty hoặc nhóm R&D muốn áp dụng AI/ML bền vững.  

 

Những điểm hạn chế / cần cân nhắc

  1. Chưa quá chuyên sâu ở một số mảng kỹ thuật cao

Nếu bạn muốn đào sâu vào các thuật toán mới nhất, kiến trúc mạng nơ-ron phức tạp, hay các kỹ thuật tiên tiến trong học sâu (deep learning), có thể cuốn sách này chưa đủ chi tiết chuyên môn. Nó thiên về tổng thể hơn.

  1. Cập nhật nhanh của lĩnh vực

Lĩnh vực AI/ML trong phát triển thuốc thay đổi rất nhanh. Sách được xuất bản 2022 – có vài công nghệ, phương pháp mới (ví dụ một số mô hình lớn mới, các kiến trúc transformers, mạng nơ-ron đồ thị, hay kết hợp đa omics mới) có thể chưa được cập nhật hoặc phân tích sâu.

  1. Tập trung chủ yếu vào bối cảnh quốc tế/phát triển lớn

Vì tác giả và các ví dụ chủ yếu từ các công ty, tổ chức y sinh, dược phẩm lớn ở Mỹ/châu Âu, khả năng áp dụng trong môi trường có hạn chế về dữ liệu, hạ tầng, hay ngân sách (như các nước đang phát triển) có thể gặp khó khăn.

 

Ai nên đọc cuốn này 

Cuốn này sẽ rất hữu ích với:

  • Nhóm nghiên cứu / startup / công ty dược muốn bắt đầu áp dụng AI/ML vào phát triển thuốc và cần một cái nhìn tổng thể: cả kỹ thuật, quản lý, quy chế.
  • Các học viên/thạc sĩ/tiến sĩ trong lĩnh vực dược, sinh học phân tử, tin học y sinh muốn hiểu xu hướng, ứng dụng thực tế, và cách tổ chức dữ liệu & AI trong R&D thuốc.
  • Những người quản lý, lãnh đạo R&D hoặc người đưa ra quyết định muốn hiểu sẽ cần đến những gì để đưa AI/ML vào hoạt động: hạ tầng, dữ liệu, đội ngũ, quy định.

 

Đánh giá tổng quan

Cuốn sách này đóng vai trò là sách tham khảo/chỉ dẫn chiến lược + tổng quan thực tiễn. Nó không thay thế các bài báo chuyên sâu nhưng là một trong những cuốn sách tốt để hình thành cái nhìn tổng thể, hiểu được nơi nào có thể áp dụng AI/học máy & cách làm như thế nào.

 

Khoa học dữ liệu và trí tuệ nhân tạo trong phát triển thuốc

Khoa học dữ liệu được áp dụng trong phát triển thuốc như thế nào?

Nếu AI thiên về mô hình thông minh tự động, thì khoa học dữ liệu (Data Science) lại là “nền móng” quan trọng trong phát triển thuốc. Trong thực tế, AI chỉ hiệu quả khi có dữ liệu đủ chất lượng – mà đó chính là vai trò của khoa học dữ liệu. Dưới đây là một số ứng dụng của khoa học dữ liệu trong phát triển thuốc.

  1. Khám phá thuốc (drug discovery)
  • Khai thác cơ sở dữ liệu hóa chất & sinh học: Khoa học dữ liệu giúp làm sạch, tích hợp, và phân tích dữ liệu từ các cơ sở dữ liệu như PubChem, ChEMBL, Protein Data Bank…
  • Phát hiện mẫu hình (pattern recognition): Thống kê và học máy được dùng để nhận ra mối liên hệ giữa cấu trúc phân tử và hoạt tính sinh học (QSAR – Quantitative Structure-Activity Relationship).
  • Phân tích dược liệu tự nhiên: Khai thác dữ liệu từ hàng nghìn loài thực vật để tìm hoạt chất tiềm năng.
  1. Tiền lâm sàng
  • Dự đoán ADMET: Khoa học dữ liệu kết hợp mô hình toán thống kê để dự đoán dược động học và độc tính.
  • Tích hợp đa omics (genomics, proteomics, metabolomics): Giúp tìm ra mục tiêu sinh học của thuốc (drug target) liên quan đến bệnh.
  1. Thử nghiệm lâm sàng
  • Phân tích dữ liệu người bệnh: Sử dụng dữ liệu từ hồ sơ sức khỏe điện tử (EHR), hình ảnh y khoa, dữ liệu gen để chọn nhóm người bệnh phù hợp.
  • Thống kê tiên tiến: Khoa học dữ liệu áp dụng Bayesian statistics, survival analysis… để thiết kế và phân tích kết quả thử nghiệm.
  • An toàn và cảnh giác dược: Phân tích dữ liệu báo cáo tác dụng phụ (cảnh giác dược).
  1. Sản xuất & thương mại hóa
  • Tối ưu quy trình sản xuất bằng phân tích dữ liệu thời gian thực (process analytical technology – PAT).
  • Dự báo nhu cầu thuốc: Ứng dụng phân tích dữ liệu lớn để quản lý chuỗi cung ứng và tránh thiếu hụt.
  • Giám sát sau thương mại hóa (post-marketing surveillance): Phân tích dữ liệu kê đơn, đáp ứng của người bệnh để phát hiện sớm rủi ro.

Trí tuệ nhân tạo đã được áp dụng trong phát triển thuốc như thế nào?

Ứng dụng trí tuệ nhân tạo (AI) trong phát triển thuốc (drug discovery & development) hiện nay đang được xem như một cuộc cách mạng vì nó giúp rút ngắn thời gian, giảm chi phí và tăng tỉ lệ thành công. Các hướng áp dụng chính gồm:

  1. Khám phá thuốc (drug discovery)
  • Dự đoán cấu trúc và hoạt tính của phân tử: AI (như AlphaFold của DeepMind) dự đoán cấu trúc 3D của protein, giúp xác định cách thuốc có thể liên kết với phân tử mục tiêu.
  • Sàng lọc phân tử ảo (virtual screening): Thay vì thử nghiệm hàng triệu hợp chất trong phòng thí nghiệm, AI có thể phân tích cơ sở dữ liệu hóa chất khổng lồ để chọn ra những ứng viên tiềm năng.
  • Thiết kế thuốc mới trên máy tính (de novo drug design): Các mô hình tạo sinh tạo ra phân tử mới có đặc tính mong muốn (độ hòa tan, độ bền, ít độc tính).
  1. Tiền lâm sàng (preclinical)
  • Dự đoán ADMET (Absorption, Distribution, Metabolism, Excretion, Toxicity): AI giúp dự báo thuốc sẽ hấp thụ như thế nào, có gây độc gan/thận không, từ đó loại bỏ sớm các ứng viên kém tiềm năng.
  • Mô phỏng tương tác sinh học: AI hỗ trợ dự đoán phản ứng giữa thuốc và nhiều mục tiêu sinh học khác nhau để phát hiện tác dụng phụ tiềm ẩn.
  1. Thử nghiệm lâm sàng (clinical trials)
  • Chọn người bệnh phù hợp: AI phân tích hồ sơ y tế, dữ liệu gen, dữ liệu hình ảnh để chọn nhóm người bệnh có khả năng đáp ứng tốt nhất với thuốc thử nghiệm.
  • Theo dõi & dự báo hiệu quả: AI xử lý dữ liệu thời gian thực từ thiết bị đeo, xét nghiệm để đánh giá nhanh hiệu quả và an toàn.
  • Thiết kế thử nghiệm tối ưu: Giúp giảm số bệnh nhân, rút ngắn thời gian mà vẫn đảm bảo độ tin cậy thống kê.
  1. Sản xuất & quản lý thuốc
  • Tối ưu quy trình sản xuất: AI dự đoán các điều kiện hóa học–sinh học tối ưu, giảm sai sót trong quy trình.
  • Giám sát chất lượng & phân phối: AI hỗ trợ kiểm soát chất lượng và dự đoán nhu cầu trong chuỗi cung ứng.
  1. Một số ví dụ thực tế
  • Exscientia (Anh): phát triển thuốc ung thư sử dụng AI, có ứng viên đã vào thử nghiệm lâm sàng.
  • Insilico Medicine: dùng AI để tìm thuốc xơ phổi, rút ngắn thời gian từ 4–5 năm xuống còn chưa tới 18 tháng.
  • Bayer, Novartis, Pfizer: hợp tác với các công ty AI để tăng tốc phát triển thuốc mới.

Có thể thấy, AI không thay thế nhà khoa học, nhưng nó đóng vai trò là “trợ lý siêu tốc độ” trong việc xử lý lượng dữ liệu khổng lồ, gợi ý hướng nghiên cứu, và giảm tỷ lệ thất bại vốn rất cao trong phát triển thuốc truyền thống.

Ở Việt Nam, việc ứng dụng trí tuệ nhân tạo trong phát triển thuốc còn khá mới mẻ, việc dùng AI chủ yếu ở các startup hoặc trung tâm nghiên cứu nhỏ. Việt Nam hiện mới dừng ở mức ứng dụng AI hỗ trợ phân tích dữ liệu người bệnh và thiết kế thử nghiệm, nhưng chưa nhiều do hạ tầng dữ liệu y tế còn hạn chế.

 

Thách thức ở Việt Nam

  • Thiếu dữ liệu chuẩn hóa: Dữ liệu y sinh, hồ sơ bệnh án còn phân tán, không đầy đủ hoặc không dễ tiếp cận
  • Thiếu hạ tầng điện toán lớn: Các mô hình AI trong phát triển thuốc cần siêu máy tính/GPU mạnh, mà hiện còn hạn chế.
  • Nguồn nhân lực liên ngành: Chưa nhiều chuyên gia vừa am hiểu dược học, sinh học phân tử, vừa giỏi công nghệ.
  • Rào cản chi phí và quy định: Việc phát triển thuốc mới bắt buộc phải trải qua nhiều giai đoạn và rất tốn kém, nhất là ở giai đoạn thử nghiệm. Quy định về sở hữu trí tuệ, đạo đức AI trong y sinh vẫn đang được xây dựng.

Triển vọng

  • Với chiến lược Chuyển đổi số y tế đến 2030, Việt Nam đang thúc đẩy kết nối dữ liệu y tế quốc gia → tạo nền tảng cho AI trong dược phẩm.
  • Khả năng cao trong 5–10 năm tới, các thuốc nguồn gốc dược liệu Việt Nam sẽ là lĩnh vực sớm được hưởng lợi từ AI (do Việt Nam có nguồn tài nguyên phong phú và nhu cầu nội địa lớn).
  • Các viện nghiên cứu và startup công nghệ sinh học trong nước cũng có cơ hội hợp tác với các công ty AI quốc tế để rút ngắn khoảng cách.

Tóm lại, ở Việt Nam, AI trong phát triển thuốc vẫn ở giai đoạn khởi đầu, thử nghiệm, chưa có sản phẩm thương mại rõ rệt, nhưng đang mở ra tiềm năng rất lớn, đặc biệt khi hạ tầng dữ liệu y tế và công nghệ điện toán được cải thiện.

 

Có thể nói: Khoa học dữ liệu là “nhiên liệu” và AI là “động cơ”. Ở đâu có dữ liệu y sinh đủ lớn và đủ sạch, ở đó AI sẽ phát huy sức mạnh trong phát triển thuốc.

Dưới đây là bảng so sánh AI và Khoa học dữ liệu trong phát triển thuốc

Tiêu chí Khoa học dữ liệu (Data Science) Trí tuệ nhân tạo (AI)
Bản chất Phân tích, xử lý, khai thác dữ liệu để tìm ra thông tin hữu ích. Mô hình, thuật toán thông minh có khả năng tự học từ dữ liệu để đưa ra dự đoán/thiết kế mới.
Vai trò trong phát triển thuốc – Làm sạch, tích hợp dữ liệu từ nhiều nguồn (gen, protein, bệnh án, thử nghiệm).

– Khám phá mối quan hệ dữ liệu (ví dụ: cấu trúc phân tử ↔ hoạt tính).

– Tạo ra mô hình dự đoán cấu trúc protein, độc tính thuốc.

– Thiết kế phân tử mới, tối ưu hóa thuốc ứng viên.

Ứng dụng cụ thể – Thống kê lâm sàng.

– Dự đoán ADMET.

– Phát hiện mẫu hình trong dữ liệu thuốc/dược liệu.

– AlphaFold dự đoán cấu trúc protein.
– Generative AI thiết kế phân tử thuốc mới.

– Hệ thống chọn người bệnh phù hợp cho thử nghiệm.

Điểm mạnh – Giúp hiểu rõ dữ liệu, tìm quy luật và giải thích.

– Cần thiết ở giai đoạn đầu để chuẩn hóa dữ liệu.

– Xử lý nhanh dữ liệu khổng lồ.
– Khả năng tạo ra ý tưởng/ thuốc ứng viên mới mà con người khó nghĩ ra.
Điểm yếu – Phụ thuộc vào kỹ năng phân tích, không tự động sinh ý tưởng mới. – Phụ thuộc vào dữ liệu sạch, đủ lớn.
– Thường khó giải thích (black-box).

 

Cảm ơn quý độc giả đã tìm hiểu về cuốn sách, để sở hữu cuốn sách quý độc giả hãy tìm kiếm tại chuyên mục “Cửa hàng” của chúng tôi, xin trân trọng cảm ơn!