Skip to content

Mẹo Công Nghệ

Mẹo Công Nghệ

  • Home » 
  • Máy Tính » 
  • Thử Thách AI Tái Tạo Ảnh Lịch Sử: Giới Hạn & Tiềm Năng

Thử Thách AI Tái Tạo Ảnh Lịch Sử: Giới Hạn & Tiềm Năng

By Administrator Tháng 8 1, 2025 0
Bức ảnh lịch sử "Migrant Mother" của Dorothea Lange mô tả người mẹ và các con trong thời kỳ Đại Suy Thoái.
Table of Contents

Trong kỷ nguyên công nghệ hiện đại, các mô hình trí tuệ nhân tạo (AI) dường như đang sở hữu năng lực “phép thuật”, có thể tạo ra hình ảnh từ văn bản chỉ với vài cú nhấp chuột. Điều này đặt ra một câu hỏi lớn: Liệu AI có thể tái tạo được sự tinh tế, “linh hồn” và không khí độc đáo của những bức ảnh lịch sử kinh điển, từng ghi dấu ấn sâu đậm trong thế kỷ 20? Chúng ta sẽ cùng nhau khám phá tiềm năng và những giới hạn của công nghệ AI tạo ảnh thông qua một thử nghiệm thực tế với Fotor AI, một trong những công cụ chuyển văn bản thành ảnh phổ biến hiện nay.

Bài viết này sẽ đi sâu vào từng trường hợp cụ thể, từ chân dung con người đầy cảm xúc đến các cảnh quan hùng vĩ và khoảnh khắc đô thị sống động, để đánh giá mức độ thành công của AI trong việc “bắt chước” các tác phẩm nhiếp ảnh huyền thoại. Liệu những thuật toán phức tạp có thể thay thế bàn tay tài hoa và cái nhìn độc đáo của các nhiếp ảnh gia vĩ đại, hay chúng ta vẫn còn một chặng đường dài để AI thực sự chạm đến giá trị nghệ thuật và văn hóa của ảnh lịch sử?

Vì Sao Chúng Ta Thử Nghiệm Điều Này?

Các mô hình AI tạo ảnh đang phát triển mạnh mẽ đến mức tưởng chừng có thể tạo ra bất cứ thứ gì chỉ bằng cách sử dụng lời nhắc (prompts) phù hợp. Mục đích của thử nghiệm này là để kiểm chứng khả năng thực sự của chúng. Trong khi nhiều người sáng tạo lo sợ về sự thống trị của AI trong tương lai, các nhiếp ảnh gia nhìn chung vẫn khá an toàn, ít nhất là cho đến thời điểm hiện tại, vì một lý do đơn giản: họ đang ghi lại thực tế.

Những bức ảnh được sử dụng trong bài viết này không chỉ là những kiệt tác của nhiếp ảnh mà còn là những “viên nang thời gian”, gói gọn một giai đoạn lịch sử. Một mô hình AI có thể tạo ra hình ảnh với “cảm giác” tương tự, nhưng việc mong đợi một hình ảnh do AI tạo ra có thể mang bất kỳ giá trị văn hóa quan trọng nào là điều vô lý.

Công cụ mà chúng tôi lựa chọn cho thử nghiệm này là Fotor AI, một trình tạo ảnh từ văn bản tương đối đơn giản nhưng thường mang lại kết quả khá ổn định. Tuy nhiên, Fotor AI không phải là Midjourney và mặc dù nó rất tốt cho nhiều phong cách nghệ thuật khác nhau, nhưng “kỹ năng nhiếp ảnh” của nó đôi khi còn khá thô sơ. Điều này đặc biệt đúng khi cố gắng yêu cầu mô hình tái tạo một bức ảnh phù hợp với thời kỳ của ảnh gốc.

AI Xử Lý Các Chủ Thể Con Người Thế Nào?

Thử thách đầu tiên dành cho AI là tái tạo các bức chân dung con người đầy cảm xúc, vốn đòi hỏi sự thấu hiểu về ánh sáng, bố cục và tâm lý.

Kiệt Tác “Migrant Mother” (Dorothea Lange)

Dorothea Lange là huyền thoại đầu tiên được “trị liệu” bởi AI. Bức ảnh “Migrant Mother” (Người mẹ di cư) là một trong những tác phẩm mang tính biểu tượng nhất mọi thời đại, và chúng tôi đã lầm tưởng rằng Fotor AI sẽ quen thuộc với nó.

Bức ảnh lịch sử "Migrant Mother" của Dorothea Lange mô tả người mẹ và các con trong thời kỳ Đại Suy Thoái.Bức ảnh lịch sử "Migrant Mother" của Dorothea Lange mô tả người mẹ và các con trong thời kỳ Đại Suy Thoái.

Thế nhưng, mô hình này không giỏi về nhận diện tên, và chúng tôi gần như phải mô tả chi tiết bức ảnh cho đến khi nó “hiểu” được ý tưởng. Dưới đây là kết quả:

Hình ảnh được AI Fotor tạo ra, mô phỏng mẹ và hai con trong thời kỳ khủng hoảng, có sự khác biệt về ánh sáng.Hình ảnh được AI Fotor tạo ra, mô phỏng mẹ và hai con trong thời kỳ khủng hoảng, có sự khác biệt về ánh sáng.

Khi xem xét kỹ hơn, vấn đề lớn nhất là ánh sáng. Trong bức ảnh gốc, chủ thể được chiếu sáng bằng ánh sáng tự nhiên, trong khi AI lại “ban tặng” cho “người mẹ” của chúng ta một ánh sáng studio hiện đại. Bức ảnh cũng trông quá bóng bẩy theo ý kiến cá nhân, mặc dù điều này có thể được khắc phục bằng một chút nhiễu hạt và hiệu ứng film grain.

Về bố cục, đây là một thất bại nhỏ. Dorothea Lange đã cẩn thận sắp xếp khung hình để kể câu chuyện về một người bị ảnh hưởng bởi cuộc Đại Suy Thoái, với từng chi tiết từ cắt cúp đến ánh sáng đều góp phần vào thông điệp. Mặt khác, AI vẫn còn phải vật lộn với ý nghĩa ẩn dụ và tầng lớp thông tin sâu sắc hơn, vì vậy không có gì trong số đó được truyền tải vào kết quả cuối cùng.

Fotor cũng cung cấp tùy chọn chuyển ảnh thành ảnh (image-to-image), và phương pháp này đã mang lại kết quả gần hơn (ít nhất là về bố cục):

Kết quả AI khi dùng ảnh "Migrant Mother" làm đầu vào, cho thấy bố cục tốt hơn nhưng chất lượng giảm.Kết quả AI khi dùng ảnh "Migrant Mother" làm đầu vào, cho thấy bố cục tốt hơn nhưng chất lượng giảm.

Mặc dù những hình ảnh này khó phân biệt, chúng tôi không hài lòng với kết quả vì Fotor dường như đã áp dụng một bộ lọc làm đẹp chất lượng thấp lên chủ thể. Vậy còn một cảnh phức tạp hơn thì sao?

“Nixon in China” (Oliver F. Atkins)

Bức ảnh lịch sử cựu Tổng thống Richard Nixon dùng bữa tối với các quan chức Trung Quốc.Bức ảnh lịch sử cựu Tổng thống Richard Nixon dùng bữa tối với các quan chức Trung Quốc.

Với bức ảnh này, chúng ta sẽ chuyển nhanh đến đầu những năm 70 và thử tái tạo bức ảnh “Nixon in China” của Oliver F. Atkins. Dưới đây là phiên bản của Fotor AI. Điều đầu tiên bạn sẽ nhận thấy là Fotor rõ ràng không biết Richard Nixon là ai (mô hình có lẽ sẽ “phát nổ” nếu chúng ta sử dụng lời nhắc “Watergate”).

Hình ảnh AI mô tả một người đàn ông dùng đũa tại bàn ăn, được bao quanh bởi các quan chức Trung Quốc.Hình ảnh AI mô tả một người đàn ông dùng đũa tại bàn ăn, được bao quanh bởi các quan chức Trung Quốc.

Ý chính của bức ảnh vẫn còn đó (bao gồm cả sự bối rối trước một miếng thức ăn trên đũa), nhưng bố cục và bối cảnh quá khác biệt. Chúng tôi có lẽ sẽ không thể nhận ra hình ảnh do AI tạo ra dựa trên cái gì nếu chưa nhìn thấy ảnh gốc.

Tùy chọn image-to-image cho ra bố cục tương tự nhưng chất lượng tổng thể lại giảm đáng kể. Các khuôn mặt bị méo mó, đây là một trong nhiều dấu hiệu của hình ảnh AI kém chất lượng.

Hình ảnh AI mô phỏng cựu tổng thống Richard Nixon ăn tối cùng quan chức Trung Quốc, chất lượng ảnh thấp.Hình ảnh AI mô phỏng cựu tổng thống Richard Nixon ăn tối cùng quan chức Trung Quốc, chất lượng ảnh thấp.

Khả Năng Của AI Với Cảnh Vật Và Vật Thể Vô Tri

Tiếp theo, chúng ta sẽ xem xét cách AI xử lý các cảnh phức tạp hơn, nơi các vật thể và yếu tố môi trường đóng vai trò chủ đạo.

Thảm Họa “The Hindenburg Disaster” (Sam Shere)

Bắt đầu với kiệt tác “The Hindenburg Disaster” của Sam Shere. Bức ảnh “ngàn năm có một” này cực kỳ phức tạp, vì vậy đây sẽ là một thử thách tốt cho AI.

Bức ảnh nổi tiếng ghi lại khoảnh khắc khinh khí cầu Hindenburg bốc cháy và rơi xuống.Bức ảnh nổi tiếng ghi lại khoảnh khắc khinh khí cầu Hindenburg bốc cháy và rơi xuống.

Fotor ít nhiều đã hiểu được những gì chúng tôi yêu cầu.

Hình ảnh AI mô tả cảnh tai nạn khinh khí cầu Hindenburg, với lửa bùng lên nhưng khí cầu vẫn nguyên vẹn.Hình ảnh AI mô tả cảnh tai nạn khinh khí cầu Hindenburg, với lửa bùng lên nhưng khí cầu vẫn nguyên vẹn.

Chúng tôi dùng từ “ít nhiều” vì khinh khí cầu vẫn còn nguyên vẹn mặc dù nó đang bốc cháy. Nó cũng quá gần mặt đất và không thể tái tạo được bố cục của bức ảnh gốc.

Khi sử dụng hình ảnh gốc làm đầu vào, gần như không thể phân biệt hai hình ảnh:

Hình ảnh AI tái tạo thảm họa Hindenburg, trông rất giống ảnh gốc nhưng là sản phẩm của AI.Hình ảnh AI tái tạo thảm họa Hindenburg, trông rất giống ảnh gốc nhưng là sản phẩm của AI.

Còn một cảnh không dễ nhận biết ngay lập tức thì sao? Bức ảnh “The Cactus Hot Air Balloon” của Léon Gimpel hoàn toàn phù hợp.

Bức ảnh hiếm hoi mô tả hai khinh khí cầu trong không gian kín tại Paris đầu thế kỷ 20.Bức ảnh hiếm hoi mô tả hai khinh khí cầu trong không gian kín tại Paris đầu thế kỷ 20.

Đây cũng là một trong những ví dụ hiếm hoi về việc sử dụng nhiếp ảnh màu từ đầu thế kỷ 20, vì vậy sẽ thú vị để xem liệu AI có thể tái tạo được cái nhìn độc đáo đó hay không. Tiết lộ trước: nó không thể.

Hình ảnh AI tạo ra hai khinh khí cầu trong không gian kín tại Paris, với bố cục và màu sắc khác ảnh gốc.Hình ảnh AI tạo ra hai khinh khí cầu trong không gian kín tại Paris, với bố cục và màu sắc khác ảnh gốc.

Bối cảnh (Grand Palais, Paris) thì đúng, nhưng bố cục và chủ thể hầu như không giống ảnh gốc. Màu sắc cũng không đúng với thời kỳ. Sử dụng hình ảnh gốc làm lời nhắc mang lại kết quả tốt hơn nhiều:

Kết quả AI khi dùng ảnh "The Cactus Hot Air Balloon" làm đầu vào, cho thấy ảnh được tái tạo theo phong cách màu nước.Kết quả AI khi dùng ảnh "The Cactus Hot Air Balloon" làm đầu vào, cho thấy ảnh được tái tạo theo phong cách màu nước.

Tuy nhiên, có một vấn đề nhỏ. Có vẻ như Fotor chỉ đơn giản là tái tạo lại hình ảnh gốc theo phong cách màu nước/pastel, mặc dù chúng tôi đã sử dụng các lời nhắc phủ định để ngăn mô hình làm điều đó. Do đó, bạn không nên mong đợi nhiều về khả năng nâng cao chất lượng ở đây.

AI Có Thể Tái Tạo Phong Cảnh và Cảnh Đô Thị?

Phân tích cuối cùng tập trung vào khả năng của AI trong việc tái hiện vẻ đẹp của phong cảnh tự nhiên và sự hối hả của cảnh đô thị.

“Moonrise, Hernandez, New Mexico” (Ansel Adams)

Vì việc sử dụng các bộ lọc đen trắng màu cam và vàng để chơi với độ tương phản, cùng với cách tiếp cận bậc thầy trong phòng tối, phong cách của Ansel Adams dễ dàng nhận biết và rất khó tái tạo.

Bức ảnh phong cảnh đen trắng nổi tiếng của Ansel Adams, mô tả cảnh trăng mọc trên thị trấn sa mạc Hernandez.Bức ảnh phong cảnh đen trắng nổi tiếng của Ansel Adams, mô tả cảnh trăng mọc trên thị trấn sa mạc Hernandez.

Vì vậy, tất nhiên, chúng tôi đã quyết định cho Fotor AI một bài kiểm tra khó khăn. Mặc dù cảnh không hề giống nhau, nhưng độ tương phản lại gợi ý về phong cách của Ansel Adams.

Hình ảnh AI mô tả cảnh thị trấn sa mạc vào ban đêm với ánh trăng, gợi nhớ phong cách Ansel Adams nhưng không chính xác.Hình ảnh AI mô tả cảnh thị trấn sa mạc vào ban đêm với ánh trăng, gợi nhớ phong cách Ansel Adams nhưng không chính xác.

Tùy chọn image-to-image tốt hơn nhiều về mặt tổng thể nhưng hình ảnh lại mất đi tất cả các chi tiết nhỏ hơn:

Hình ảnh AI tái tạo phong cảnh với ánh trăng theo phong cách Ansel Adams, tổng thể tốt nhưng thiếu chi tiết.Hình ảnh AI tái tạo phong cảnh với ánh trăng theo phong cách Ansel Adams, tổng thể tốt nhưng thiếu chi tiết.

Chúng tôi là một fan hâm mộ lớn của nhiếp ảnh đường phố, nhưng thật không may, hầu hết các bức ảnh đường phố mang tính biểu tượng vẫn chưa thuộc phạm vi công cộng. Do đó, bức ảnh kinh điển “Kissing the War Goodbye” của Victor Jorgensen sẽ là lựa chọn phù hợp.

Bức ảnh nổi tiếng mô tả một thủy thủ hôn một y tá tại Quảng trường Thời đại, đánh dấu kết thúc Thế chiến II.Bức ảnh nổi tiếng mô tả một thủy thủ hôn một y tá tại Quảng trường Thời đại, đánh dấu kết thúc Thế chiến II.

Đúng như bạn có thể mong đợi từ Fotor ở thời điểm này, kết quả cuối cùng là khá ổn. Tuy nhiên, có hai vấn đề.

Hình ảnh AI tái tạo cảnh thủy thủ hôn y tá ở Quảng trường Thời đại, trông dàn dựng và giống ảnh khác hơn.Hình ảnh AI tái tạo cảnh thủy thủ hôn y tá ở Quảng trường Thời đại, trông dàn dựng và giống ảnh khác hơn.

Đầu tiên, nó gần giống với một bức ảnh khác của cảnh này do Alfred Eisenstadt chụp, và thứ hai, giờ đây nó trông hoàn toàn dàn dựng (trong khi bức gốc thì không).

Về mặt kỹ thuật, ánh sáng giống như ánh sáng studio hiện đại và bức ảnh quá tương phản so với sở thích của chúng tôi. Hãy sử dụng hình ảnh gốc làm lời nhắc:

Hình ảnh AI tái tạo cảnh hôn ở Quảng trường Thời đại, chủ thể chính đẹp nhưng người nền bị biến dạng.Hình ảnh AI tái tạo cảnh hôn ở Quảng trường Thời đại, chủ thể chính đẹp nhưng người nền bị biến dạng.

Kết quả này là một sự pha trộn. Trong khi chúng tôi yêu thích vẻ ngoài của các chủ thể chính, khuôn mặt của những người ở hậu cảnh giờ đây trông thẳng như một cảnh trong phim kinh dị – một điều không bao giờ tốt.

Kết Luận

Qua loạt thử nghiệm sâu rộng với Fotor AI trong việc tái tạo các bức ảnh lịch sử nổi tiếng, chúng ta có thể thấy rằng công nghệ AI tạo ảnh đã đạt được những bước tiến đáng kể. Fotor AI có thể tạo ra những hình ảnh “ổn” và đôi khi đáng kinh ngạc từ những lời nhắc văn bản, đặc biệt là khi dùng tính năng chuyển ảnh thành ảnh. Tuy nhiên, kết quả vẫn còn rất không nhất quán, đặc biệt khi đòi hỏi độ chính xác cao về chi tiết, cảm xúc tinh tế, hoặc nhận diện các nhân vật/cảnh cụ thể.

Giới hạn lớn nhất của AI hiện nay nằm ở khả năng hiểu ngữ cảnh sâu sắc, truyền tải thông điệp ẩn ý, và đặc biệt là nắm bắt được “linh hồn” thực sự của một tác phẩm nhiếp ảnh – điều chỉ có thể có được từ con mắt và kinh nghiệm của một nhiếp ảnh gia chuyên nghiệp. Các mô hình AI hiện tại vẫn gặp khó khăn với ánh sáng chân thực, bố cục kể chuyện và tránh tạo ra các chi tiết bất thường (như khuôn mặt biến dạng).

Tổng thể, dù các công cụ như Fotor AI mang lại trải nghiệm thú vị và tiềm năng lớn cho mục đích minh họa hoặc tạo ý tưởng, chúng vẫn chưa thể thay thế hoàn toàn vai trò của nhiếp ảnh gia trong việc ghi lại thực tế và tạo ra những tác phẩm mang giá trị văn hóa, lịch sử vĩnh cửu. Midjourney và DALL-E vẫn giữ vững vị thế dẫn đầu trong lĩnh vực tạo ảnh AI chân thực từ lời nhắc. Dù công nghệ AI đang phát triển vượt bậc, giá trị của một bức ảnh ghi lại khoảnh khắc chân thực và cảm xúc sâu sắc vẫn là vô giá. Bạn nghĩ sao về khả năng của AI trong nhiếp ảnh và tiềm năng của nó trong tương lai? Hãy chia sẻ ý kiến của bạn bên dưới!

Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

Bảo Vệ Quyền Riêng Tư Trên Windows 11: 7 Cài Đặt Bạn Cần Vô Hiệu Hóa Ngay

Next post

Lập Kế Hoạch Buổi Tối: Bí Quyết Tăng Năng Suất Vượt Trội Với Công Nghệ

Administrator

Related Posts

Categories Máy Tính Thử Thách AI Tái Tạo Ảnh Lịch Sử: Giới Hạn & Tiềm Năng

Group Policy Editor: Công Cụ Bí Mật Biến Windows 11 Thành Cỗ Máy Của Riêng Bạn

Categories Máy Tính Thử Thách AI Tái Tạo Ảnh Lịch Sử: Giới Hạn & Tiềm Năng

Cách Sở Hữu Phần Mềm Bản Quyền Giá Rẻ Hợp Pháp, Tiết Kiệm

Categories Máy Tính Thử Thách AI Tái Tạo Ảnh Lịch Sử: Giới Hạn & Tiềm Năng

Thanh Taskbar Windows 11: Tính Năng Thu Nhỏ Biểu Tượng Mới Có Thực Sự Hữu Ích?

Leave a Comment Hủy

Recent Posts

  • Group Policy Editor: Công Cụ Bí Mật Biến Windows 11 Thành Cỗ Máy Của Riêng Bạn
  • Cách Sở Hữu Phần Mềm Bản Quyền Giá Rẻ Hợp Pháp, Tiết Kiệm
  • Thanh Taskbar Windows 11: Tính Năng Thu Nhỏ Biểu Tượng Mới Có Thực Sự Hữu Ích?
  • Gmail Tốt Hơn Outlook? 7 Lý Do Bạn Nên Chuyển Đổi Ngay
  • Photoshop trên Android: Khi Công Cụ Chỉnh Sửa Ảnh Chuyên Nghiệp Đến Tay Bạn

Recent Comments

Không có bình luận nào để hiển thị.
Copyright © 2025 Mẹo Công Nghệ - Powered by Nevothemes.
Offcanvas
Offcanvas

  • Lost your password ?