Bạn có tưởng tượng một bức ảnh trực tiếp từ trí tưởng tượng của bạn không? Bây giờ bạn có thể làm điều đó trong vài phút nhờ vào các công cụ tạo hình ảnh AI như Midjourney. Dù bạn thiếu kỹ năng nghệ thuật hay chưa từng cầm một cây cọ trong đời, trí tuệ nhân tạo có thể tạo ra nghệ thuật số chỉ trong vài giây – tất cả những gì bạn cần là một chút văn bản mô tả hình ảnh bạn đang nghĩ đến. Nhưng Midjourney hoạt động như thế nào? Dưới đây là mọi thứ bạn cần biết.
Midjourney là gì?
Midjourney là một ví dụ về trí tuệ nhân tạo sinh học có thể chuyển đổi câu hỏi ngôn ngữ tự nhiên thành hình ảnh. Đây chỉ là một trong nhiều công cụ tạo hình ảnh dựa trên học máy đã xuất hiện gần đây. Mặc dù vậy, nó đã trở thành một trong những tên tuổi lớn nhất trong lĩnh vực trí tuệ nhân tạo cùng với DALL-E và Stable Diffusion.
Với Midjourney, bạn có thể tạo ra các hình ảnh chất lượng cao từ các yêu cầu dựa trên văn bản đơn giản. Bạn không cần phần cứng hay phần mềm đặc biệt để sử dụng Midjourney, vì nó hoạt động hoàn toàn qua ứng dụng chat Discord. Tuy nhiên, bạn sẽ phải trả ít nhất một chút tiền trước khi bạn có thể bắt đầu tạo ra hình ảnh. Điều này khác với nhiều đối thủ khác, thường cung cấp ít nhất một số lượng hình ảnh miễn phí.
Mặc dù vậy, ngưỡng vào Midjourney rất thấp và bất kỳ ai cũng có thể sử dụng nó để tạo ra các hình ảnh có vẻ thực tế trong vài phút. Kết quả có thể dao động từ khá kỳ lạ đến rất đẹp mắt, tùy thuộc vào yêu cầu.
Midjourney có thể tạo ra những hình ảnh đẹp và thuyết phục từ một mô tả văn bản đơn giản.
Trong một số trường hợp, hình ảnh từ Midjourney đã khiến các chuyên gia về nhiếp ảnh và lĩnh vực khác bị đánh lừa. Tương tự, bạn có thể đã thấy một số hình ảnh do trí tuệ nhân tạo tạo ra trên mạng xã hội mà nhìn rất thuyết phục. Ví dụ, từ Hồng y Francis mặc áo khoác phao đến Trump bị bắt giữ ngày trước sự kiện thực sự. Nhưng chúng ta cũng đã xem thấy một số hình ảnh sáng tạo như một cảnh Star Wars theo phong cách của Wes Anderson (như hình trên).
Khác với DALL-E, được hỗ trợ bởi OpenAI – người tạo ra ChatGPT, Midjourney mô tả chính nó là một dự án tự tài trợ và độc lập. Hơn nữa, nó chưa nhận được bất kỳ nguồn tài trợ bên ngoài nào cho đến nay. Trong khi đó, OpenAI đã huy động tới 10 tỷ đô la từ Microsoft và một số nhà đầu tư khác. Vì vậy, với nguồn gốc khiêm tốn của Midjourney, kết quả của nó rất ấn tượng.
Đúng, bạn chỉ có thể truy cập Midjourney qua ứng dụng chat Discord. Tuy nhiên, Midjourney đang di chuyển đến nền tảng riêng của mình. Khi quá trình di chuyển hoàn tất, bạn sẽ không cần Discord nữa.
Midjourney hoạt động như thế nào?
Chúng ta không biết tất cả những gì về cách Midjourney hoạt động bên trong vì nó là mã nguồn đóng và chạy bằng mã nguồn độc quyền. Tuy nhiên, chúng ta có đủ thông tin về công nghệ cơ bản để cung cấp một giải thích tổng quan.
Midjourney dựa trên hai công nghệ học máy tương đối mới, gọi là mô hình ngôn ngữ lớn và mô hình thông khí. Bạn có thể đã quen biết với mô hình ngôn ngữ lớn nếu bạn đã sử dụng các chatbot trí tuệ nhân tạo sinh học như ChatGPT. Một mô hình ngôn ngữ lớn đầu tiên giúp Midjourney hiểu ý nghĩa của những từ bạn gõ vào yêu cầu của mình. Sau đó, nó được chuyển đổi thành một vector, bạn có thể tưởng tượng là một phiên bản số hóa của yêu cầu của bạn. Cuối cùng, vector này giúp hướng dẫn một quá trình phức tạp khác được biết đến là sự lan truyền.
Midjourney sử dụng mô hình lan truyền để biến nhiễu ngẫu nhiên thành nghệ thuật đẹp mắt.
Lan truyền chỉ trở nên phổ biến trong thập kỷ gần đây, giải thích sự bùng nổ đột ngột của các công cụ tạo hình ảnh trí tuệ nhân tạo. Trong một mô hình lan truyền, máy tính dần dần thêm nhiễu ngẫu nhiên vào tập dữ liệu đào tạo của nó. Theo thời gian, nó học cách khôi phục lại hình ảnh gốc bằng cách đảo ngược nhiễu. Ý tưởng là với đủ đào tạo, một mô hình như vậy có thể học cách tạo ra những hình ảnh hoàn toàn mới.
Vậy từ góc nhìn của một công cụ tạo hình ảnh trí tuệ nhân tạo, điều gì sẽ xảy ra khi bạn nhập một yêu cầu văn bản như “những con mèo trắng được đặt trong một Times Square hậu tận thế”? Nó bắt đầu với một trường nhiễu hình ảnh. Bạn có thể tưởng tượng đây là bước đầu tiên tương đương với sóng truyền hình tĩnh. Lúc này, hình ảnh không giống bất cứ điều gì bạn yêu cầu. Tuy nhiên, mô hình trí tuệ nhân tạo đã được đào tạo sẽ sử dụng lan truyền tiềm ẩn để loại bỏ nhiễu theo từng bước. Cuối cùng, nó sẽ tạo ra một bức tranh giống các đối tượng và ý tưởng trong thế giới thực.
Lưu ý rằng bạn thường cần chờ một hoặc hai phút để hình ảnh được tạo bởi trí tuệ nhân tạo phát triển hoàn chỉnh. Nếu bạn dừng quá trình sớm, bạn sẽ nhận được một hình ảnh nhiễu mà chưa trải qua đủ bước làm sạch nhiễu.
Midjourney có giá bao nhiêu?
Trong khi chúng ta đã thấy các chatbot như ChatGPT và Bing Chat cung cấp sử dụng gần như không giới hạn miễn phí, điều đó không thể nói với các công cụ tạo hình ảnh. Hầu hết trong số chúng đều có một số hạn chế, thậm chí Midjourney còn không cung cấp phiên dùng thử miễn phí. Điều này bởi vì mỗi nhiệm vụ tạo hình ảnh đòi hỏi một lượng tính toán lớn, đặc biệt là đơn vị xử lý đồ họa (GPU). Hơn nữa, mỗi GPU có bộ nhớ video hữu hạn, được sử dụng rất nhiều trong quá trình làm sạch nhiễu.
Vì vậy, với những điều đó trong tâm trí, không có gì ngạc nhiên khi một công cụ tạo hình ảnh trí tuệ nhân tạo tiên tiến sẽ tốn bạn một số tiền. Chúng tôi có một hướng dẫn chi tiết về giá cả và các gói đăng ký của Midjourney, nhưng bạn sẽ phải trả ít nhất 10 đô la mỗi tháng. Điều này sẽ mang lại cho bạn 3,3 giờ thời gian GPU, đủ cho khoảng 200 lần tạo hình ảnh. Trong khi đó, gói đắt nhất mang lại cho bạn 60 giờ thời gian GPU nhanh chóng với giá 120 đô la mỗi tháng.
Các gói cao cấp của Midjourney cho phép bạn tạo ra không giới hạn hình ảnh ở chế độ Thư giãn, nhưng bạn sẽ phải chờ đợi tới 10 phút. Nếu bạn không cần chất lượng tốt nhất, chúng tôi khuyến nghị bạn nên xem các công cụ tạo hình ảnh trí tuệ nhân tạo khác. Gần như tất cả các công ty công nghệ, từ Google đến Meta của Facebook, đều có các công cụ tạo hình ảnh cạnh tranh với Midjourney mà không tốn bạn một đồng xu nào.
Câu hỏi thường gặp
Midjourney đã được đào tạo trên các mẫu hình ảnh hiện có, bao gồm nghệ thuật từ nhiều nguồn khác nhau, để tạo ra những bức tranh hoàn toàn mới. Một số nghệ sĩ tin rằng các công cụ tạo hình ảnh trí tuệ nhân tạo đã vi phạm bản quyền của họ bằng cách sử dụng công việc của họ cho quá trình đào tạo. Tuy nhiên, phía khác cho rằng quá trình đào tạo thuộc loại sử dụng hợp lý.
Không, Midjourney không thể tạo ra một video đầy đủ. Nhưng nếu bạn chỉ muốn một video quá trình tạo hình ảnh của Midjourney, bạn có thể thêm tham số -video vào cuối yêu cầu của bạn.
Midjourney sử dụng một kỹ thuật học máy được biết đến là lan truyền, nhưng không rõ liệu nó có dựa trên mô hình Stable Diffusion mã nguồn mở hay không.
Không, Midjourney là một công cụ độc quyền và mã nguồn đóng của một công ty nghiên cứu đặt tại San Francisco. Nó nhằm mục tiêu trở thành một công cụ mang lại lợi nhuận.
Midjourney thuộc sở hữu của một công ty nghiên cứu độc lập cùng tên. Công cụ tạo hình ảnh này được thành lập tại San Francisco bởi David Holz, người cũng là người sáng lập công ty theo dõi tay Leap Motion cách đây mười năm.
Nguồn tham khảo: https://www.androidauthority.com/what-is-midjourney-3324590/