Sự sáng tạo dựa trên trí tuệ nhân tạo với Microsoft Designer
Cách Microsoft Team tạo ra một công cụ thiết kế trực quan cho mọi người
"Bạn có thể tưởng tượng sử dụng thứ gì đó như thế này trong đời thực không?" Đó là cảm giác như mơ mà bạn có được khi sử dụng Trình tạo hình ảnh AI tạo hình của Microsoft Designer. Gõ chữ là vẽ một con sóng nuốt thuyền theo phong cách cắt giấy trông giống như thứ gì đó từ thời kỳ in khắc gỗ Edo của Nhật Bản. Một hình ảnh chân thực về một chú kỳ lân biển lấp lánh đang quay quanh Trái đất chỉ cách đó vài câu.
Việc tạo hình ảnh bằng từ ngữ cũng siêu thực như vẽ bằng âm thanh, nhưng thậm chí còn siêu thực hơn là sự trỗi dậy của AI tạo hình. Kể từ khi nhận dạng giọng nói trở thành một phần của các sản phẩm tiêu dùng vào những năm 1980, con người đã tương tác với trí tuệ nhân tạo, nhưng AI tạo hình đã mở ra tiềm năng sáng tạo mới đáng kinh ngạc. Đối với những người tạo ra sản phẩm, thật thú vị khi nghĩ về những cách kết nối mọi người với sức mạnh đó, đặc biệt là khi sự sáng tạo thường có thể độc quyền như thế nào.
Phát triển một loại công cụ thiết kế trực quan mới
Nếu bạn từng dừng lại trên phố và thấy một người đang vẽ trên giá vẽ, bạn sẽ biết rằng việc đó giống như đang xem một nhà giả kim biến đồng thành vàng. Suy nghĩ đầu tiên của bạn thường là, "Họ đã làm điều đó như thế nào?" Nghệ sĩ có khả năng kỳ lạ là mô tả thế giới bằng hình ảnh với sự sáng tạo, trí tuệ cảm xúc và sự khéo léo. Nhiều năm luyện tập, cống hiến và tài năng tuyệt đối cần có để làm những gì họ làm sẽ không bao giờ có thể sao chép được. Nhưng đối với những loại chuyên gia sáng tạo khác hoặc bất kỳ ai muốn tạo ra các tài sản trực quan, một công cụ giúp họ biến ý tưởng của mình thành hiện thực là vô giá.
Ban đầu, động lực đằng sau Designer là đa dạng hóa hơn nữa các sản phẩm của Microsoft 365. Ngoài ứng dụng chỉnh sửa video Microsoft Clipchamp, "thực sự không có công cụ thiết kế trực quan tuyệt vời nào", Nhà thiết kế sản phẩm cao cấp Vivian Xiao, người đã đóng góp vào quá trình phát triển Image Creator của Designer, cho biết. Trong khi Designer tách ra từ công nghệ đằng sau PowerPoint Designer phổ biến được hỗ trợ bởi AI, thì sự bùng nổ của LLM trong quá trình phát triển ban đầu của Designer đã mang đến cơ hội tạo ra một công cụ thiết kế thực sự ưu tiên AI.
"Designer là một trong những sản phẩm đầu tiên tại Microsoft mà bạn có thể sử dụng để tạo hình ảnh", Trưởng phòng thiết kế Brittany Mederos cho biết. Ngay từ khi ứng dụng ra đời, cô đã đồng lãnh đạo quá trình áp dụng AI để xây dựng một công cụ thiết kế mà bất kỳ ai cũng có thể sử dụng. Việc trao quyền cho mọi người để có thể tiếp cận với sáng tạo trực quan là điều đúng đắn và đó là điều mà chúng tôi vẫn chưa thể cung cấp cho khách hàng. Giờ đây, mọi người có thể tạo đồ họa chuyên nghiệp, chỉnh sửa ảnh, thiết kế bố cục, tạo thương hiệu riêng và thiết kế bài đăng trên mạng xã hội.
Điều này có nghĩa là Designer cần khơi dậy cảm hứng, sự tò mò, niềm vui và sự học hỏi. Để làm được điều này, chúng tôi cần tạo ra trải nghiệm người dùng có thể hướng dẫn trực quan cho mọi người cách khai thác AI để tạo ra những gì họ muốn. Thiết kế UX nêu rõ cách viết lời nhắc để tạo văn bản, chẳng hạn như soạn email hoặc tài liệu, đã đặt ra một thách thức cố hữu. Khuyến khích sử dụng ngôn ngữ để tạo ra hình ảnh phức tạp hơn nhiều, đặc biệt là vì nhiều người không có vốn từ vựng trực quan.
Dạy mọi người cách prompt để tạo ra hình ảnh
Một trong những cách học cố hữu của con người là thông qua quan sát. Trẻ em học hỏi từ việc quan sát cha mẹ mình. Leonardo da Vinci đã vẽ chiếc trực thăng đầu tiên trong khi nghiên cứu cách chim bay. Tuy nhiên, khó khăn khi làm việc với AI là chúng ta vẫn chưa có bộ mô hình quen thuộc đầy đủ về cách tương tác với AI. Nhắc nhở vẫn là một khái niệm mới đối với hầu hết mọi người trên thế giới.
Để thể hiện quy trình nhắc nhở từ văn bản thành hình ảnh, Nhà thiết kế sản phẩm Jennifer Jing đã bắt đầu bằng cách tạo một video hoạt hình. Tuy nhiên, video không được người dùng đón nhận. Lấy cảm hứng từ Bing Image Creator, hiện đã đổi tên thành Designer, sử dụng lời nhắc trực quan, Jing đề xuất nhóm áp dụng một cách tiếp cận tương tự. Lời nhắc trực quan là hình ảnh do AI tạo ra, khi di chuột qua, hình ảnh sẽ hiển thị lời nhắc văn bản được sử dụng để tạo ra hình ảnh đó. Mọi người sẽ không nỗ lực nhiều để tạo hoặc tinh chỉnh lời nhắc nếu họ không chắc chắn về kết quả hoặc khả năng tạo ra đầu ra thành công của mình. Tuy nhiên, sau khi sử dụng lời nhắc trực quan, tỷ lệ thành công khi giữ và sử dụng đầu ra là rất cao.
Lời nhắc trực quan giống như một công thức nấu ăn. Bạn thấy món ăn và các thành phần bên dưới, với tùy chọn thay đổi công thức theo khẩu vị. Nhưng điều gì sẽ xảy ra nếu công thức thay đổi trở nên phổ biến? Nhóm nghiên cứu đã quan sát cách mọi người sử dụng Bing Image Creator trên mạng xã hội và tạo ra các mẫu lời nhắc dễ chia sẻ, dẫn đến một số lượt truy cập lan truyền. Mọi người biến mình thành các nhân vật Funko Pop hoặc đầu bong bóng, lấy cảm hứng từ phim hoạt hình Nhật Bản. Họ cho những chú chó của mình đóng vai chính trong các áp phích phim hoạt hình trở thành xu hướng. Các áp phích do AI tạo ra là một cuộc diễu hành của những đứa trẻ lông lá bốn chân đáng yêu: một chú chó Chihuahua và hành lý dán nhãn của nó sắp bắt đầu một cuộc phiêu lưu tuyệt vời trong khi một cậu bé đang âu yếm chú chó Golden Retriever của mình là "những người bạn mãi mãi". Giống như những bậc cha mẹ tự hào, hàng ngàn người đã chia sẻ áp phích về chú chó do AI tạo ra và họ đã đăng lại lời nhắc được sử dụng để tạo ra chúng.
Cách mọi người sử dụng Bing Image Creator sẽ truyền cảm hứng cho nhóm Thiết kế và đặt nền tảng cho việc phát triển các mẫu lời nhắc với cấu trúc câu theo phong cách Mad Libs. Mẫu này cho phép mọi người dễ dàng thay đổi và điều chỉnh chủ đề và bố cục của văn bản. Họ cũng có tùy chọn thay đổi bất kỳ phần nào của văn bản không phù hợp với nhu cầu của mình.
Một thách thức khác liên quan đến lời nhắc là giúp mọi người hình dung ra những gì trong tâm trí họ khi họ không có vốn từ vựng để mô tả những gì họ đang nhìn thấy.
"Thu hẹp khoảng cách giữa những gì mọi người có trong não và những gì họ thực sự thấy trên màn hình là một trong những thách thức chính của AI", Giám đốc thiết kế sản phẩm chính Ian Curry, người chỉ đạo phát triển phần mềm, cho biết. Để giải quyết thách thức này, lời nhắc trực quan của Designer đóng vai trò như một công cụ giảng dạy. Các mẫu cho bạn tiếp xúc với nghệ thuật và thuật ngữ đồ họa như đất sét 3D, chủ nghĩa siêu thực, chủ nghĩa tối giản hoặc cắt giấy.
"Đó là những phong cách mà mọi người hướng đến nhiều nhất", Nhà thiết kế sản phẩm Kiana Price, người đã viết lời nhắc định nghĩa phong cách của các mẫu gần đây nhất của Designer, cho biết. Bên cạnh Kiana, hiện có một nhóm nội dung bao gồm một số người hoàn toàn dành riêng cho nghề viết lời nhắc. Nghệ thuật thiết kế lời nhắc đã trở thành một kỹ năng bắt buộc phải có.
Price cho biết: “Có rất nhiều tính năng và sản phẩm AI mới xuất hiện mỗi ngày, với nhu cầu về những người hiểu cả điểm mạnh và hạn chế cơ bản của hệ thống để sử dụng hệ thống một cách hợp lý như một cộng tác viên trong quy trình làm việc hàng ngày của họ”.
Các lời nhắc hiệu quả kết nối khả năng kỹ thuật của Designer với các tương tác của người dùng. Các thuật ngữ nghệ thuật hoặc thiết kế được sử dụng trong các mẫu của Designer trở thành một phần trong vốn từ vựng của người dùng. Mọi người sử dụng lại chúng để sửa đổi và tinh chỉnh các lời nhắc của riêng họ. Đối với một số khách hàng, việc nói chuyện với máy móc là điều đáng sợ và hộp nhắc trống đó có thể gây choáng ngợp như một trang giấy trắng. Các lời nhắc trực quan giúp bạn bắt đầu trong khi truyền đạt ý định theo bản năng và gợi ra hành động mà không cần giải thích.
Được hiển thị nổi bật trên giao diện của Designer, hình ảnh của lời nhắc trực quan thể hiện trình độ nghệ thuật cao mà bất kỳ người sáng tạo nào cũng có thể dễ dàng đạt được. Chúng khác nhau về phong cách, màu sắc, tông màu, ứng dụng và góc nhìn. Giống như lối đi trên thiệp chúc mừng, lời nhắc hiển thị ngày sinh nhật, ngày lễ, lễ kỷ niệm, thể thao, du lịch, giải trí, v.v. Các phiên bản Designer trong tương lai có thể bao gồm các điều khiển UX cho phép bạn chỉnh sửa bố cục đầu ra, điều chỉnh màu sắc, thêm hiệu ứng cục bộ và thao tác trực tiếp hơn với hình ảnh của mình.
Thiết kế cẩn thận: hiểu sự loại trừ và ưu tiên đạo đức
Designer khác biệt so với hầu hết các phần mềm thiết kế đồ họa, vốn đắt hơn và độc quyền hơn theo truyền thống. Chúng thường yêu cầu nền tảng nghệ thuật hoặc bộ kỹ năng cụ thể mà chỉ có thể có được bằng cách tham gia các lớp học hoặc đến trường nghệ thuật. Học cách sử dụng các chương trình đó là một cam kết lâu dài và là rào cản đối với một số người sáng tạo tương lai không đủ khả năng chi trả.
Với sự ra đời của các mô hình ngôn ngữ lớn, việc đảm bảo các hoạt động AI có đạo đức bảo vệ môi trường, cộng đồng dễ bị tổn thương và sở hữu trí tuệ của nghệ sĩ là rất quan trọng. Mặc dù rất thú vị khi thấy sự phát triển của những tiến bộ công nghệ mới này, nhưng việc thiết kế AI có trách nhiệm có nghĩa là kết hợp trách nhiệm giải trình, tính minh bạch, công bằng, độ tin cậy & an toàn, quyền riêng tư & bảo mật và tính bao hàm. Trở thành nhà sản xuất sản phẩm là một trong những vai trò quan trọng nhất mà một người có thể đảm nhiệm trong bối cảnh công nghệ ngày nay. Những gì chúng ta tạo ra tác động trực tiếp đến hàng tỷ khách hàng của chúng ta, vì vậy việc thiết kế bằng AI đòi hỏi rất nhiều nhận thức và sự khiêm tốn.
Nhóm nghiên cứu biết rằng nếu họ tạo ra một trải nghiệm dễ dàng và trực quan khiến người dùng thích thú khi sáng tạo, điều đó sẽ thúc đẩy sự tự tin của mọi người và giải phóng tiềm năng sáng tạo của họ. Nỗ lực mà mọi người bỏ ra cho sản phẩm của mình sẽ mang lại ý nghĩa, đặc biệt là khi thiết kế thiệp sinh nhật cho người thân yêu hoặc tạo ra một hình ảnh đóng vai trò như một phần mở rộng của con người họ. Bằng cách phản ánh thế giới bên trong của họ ra bên ngoài, Nhà thiết kế có thể giúp củng cố ý thức thực sự về giá trị và sự thể hiện bản thân.
Bài viết được dịch từ: https://microsoft.design/articles/ai-powered-creativity-with-microsoft-designer/