I. Xây dựng tầm nhìn: Câu chuyện, chủ thể và phong cách

Để đạt kết quả tốt nhất và có khả năng kiểm soát sáng tạo tinh tế hơn, hãy thêm các yếu tố sau vào prompt của bạn:

Chủ thể (Subject): Trong hình có ai hoặc cái gì? Hãy mô tả cụ thể.
(Ví dụ: một robot pha cà phê điềm tĩnh với đôi mắt ánh xanh; một chú mèo tam thể lông xù đội chiếc mũ phù thủy nhỏ.)

Bố cục (Composition): Góc chụp được bố trí như thế nào?
(Ví dụ: cận cảnh cực độ, cảnh rộng, góc thấp, ảnh chân dung.)

Hành động (Action): Điều gì đang diễn ra?
(Ví dụ: đang pha cà phê, đang tung phép thuật, đang chạy giữa cánh đồng.)

Bối cảnh (Location): Cảnh diễn ra ở đâu?
(Ví dụ: quán cà phê tương lai trên Sao Hỏa, thư viện giả kim bừa bộn, cánh đồng ngập nắng lúc hoàng hôn.)

Phong cách (Style): Aesthetic hoặc chất liệu tổng thể của hình là gì?
(Ví dụ: hoạt hình 3D, phong cách phim noir, tranh màu nước, ảnh siêu thực, phong cách chụp sản phẩm thập niên 1990.)

Hướng dẫn chỉnh sửa (Editing Instructions): Khi chỉnh sửa một hình có sẵn, hãy mô tả trực tiếp và cụ thể.
(Ví dụ: đổi màu cà-vạt của người đàn ông thành màu xanh lá, xóa chiếc xe ở phía sau.)

II. Tinh chỉnh chi tiết: Camera, ánh sáng và định dạng

Mặc dù các prompt đơn giản vẫn hoạt động, nhưng để đạt kết quả mang tính chuyên nghiệp, bạn cần thêm những hướng dẫn cụ thể hơn. Khi xây dựng prompt, hãy vượt ra khỏi phần mô tả cơ bản và cân nhắc những yếu tố nâng cao sau:

Bố cục và tỷ lệ khung hình (Composition and aspect ratio): Xác định kích thước và bố cục khung hình.
(Ví dụ: “Poster dọc 9:16,” “Khung cảnh điện ảnh rộng 21:9.”)

Chi tiết camera và ánh sáng (Camera and lighting details): Điều hướng góc chụp như một nhà quay phim.
(Ví dụ: “Góc chụp thấp với độ sâu trường ảnh mỏng (f/1.8),” “Ánh sáng ngược lúc hoàng hôn tạo bóng dài,” “Hiệu chỉnh màu điện ảnh với tông teal trầm.”)

Chèn văn bản cụ thể (Specific text integration): Nêu rõ chữ gì cần xuất hiện và trông như thế nào.
(Ví dụ: “Tiêu đề ‘URBAN EXPLORER’ ở phía trên, font sans-serif trắng, đậm.”)

Ràng buộc tính chính xác (Factual constraints – dành cho sơ đồ/diagram): Yêu cầu độ chính xác và đảm bảo thông tin bạn cung cấp cũng phải đúng.
(Ví dụ: “Sơ đồ mặt cắt ngang chính xác theo khoa học,” “Đảm bảo tính chính xác lịch sử thời Victoria.”)

Hình ảnh tham chiếu (Reference inputs): Khi sử dụng ảnh tải lên, hãy mô tả rõ vai trò của từng ảnh.
(Ví dụ: “Dùng Ảnh A cho tư thế nhân vật, Ảnh B cho phong cách nghệ thuật, và Ảnh C cho bối cảnh phía sau.”)

III. Ví dụ về prompt: Bộ sưu tập các kỹ thuật sáng tạo

Các chiến lược prompt khác nhau có thể giúp bạn tạo ra mọi thứ — từ chỉnh sửa ảnh siêu thực cho đến những thế giới tưởng tượng đầy màu sắc. Dưới đây là một vài kỹ thuật bạn có thể thử:

1. Tạo hình ảnh với khả năng dựng chữ xuất sắc:
Chữ sắc nét, rõ ràng giúp bạn tạo poster ấn tượng, sơ đồ phức tạp, hoặc mockup sản phẩm chi tiết.

2. Sáng tạo dựa trên kiến thức thực tế:
Được xây dựng trên Gemini 3 Pro, Nano Banana tận dụng kiến thức thực tế và khả năng suy luận sâu của Gemini 3 để tạo ra hình ảnh chính xác, giàu chi tiết và sắc nét.

3. Dịch và bản địa hóa ý tưởng:
Tạo văn bản đã được bản địa hóa hoặc dịch chữ trong hình ảnh. Bạn có thể xem sản phẩm trông như thế nào ở nhiều ngôn ngữ khác nhau (phù hợp cho thị trường quốc tế), cũng như tạo poster và infographic dùng cho nhiều khu vực.

4. Sử dụng chỉnh sửa chất lượng studio:
Bạn có thể kiểm soát nhiều yếu tố để tạo ra kết quả mang đẳng cấp chuyên nghiệp. Tác động trực tiếp đến ánh sáng, góc máy, độ nét, hiệu chỉnh màu và nhiều yếu tố khác.

5. Thay đổi kích thước với độ chính xác cao:
Thử nghiệm các tỷ lệ khung hình khác nhau và tạo hình ảnh sắc nét ở độ phân giải 1K, 2K hoặc 4K trên nhiều loại sản phẩm.

6. Trộn ảnh và giữ nhân vật nhất quán:
Duy trì sự đồng nhất và độ giống nhau của nhiều nhân vật, ngay cả khi họ xuất hiện cùng nhau trong một nhóm. Bạn có thể dùng từ 6 đến 14 hình ảnh hoàn toàn không liên quan (tùy nền tảng) và hòa trộn chúng để tạo ra một hình mới.

7. Tạo và duy trì phong cách thương hiệu của bạn:
Kết xuất và áp dụng thiết kế theo phong cách thương hiệu nhất quán để dễ dàng hình dung ý tưởng. Bạn có thể phủ họa tiết, logo và artwork lên các vật thể và bề mặt 3D — từ quần áo cho đến bao bì — mà vẫn giữ được ánh sáng và chất liệu tự nhiên.

IV. Lưu ý về những hạn chế hiện tại

Trong khi chúng tôi tiếp tục phát triển và tinh chỉnh các mô hình, vẫn còn một số điểm cần cải thiện:

Độ chính xác của hình ảnh và văn bản:
Việc hiển thị chữ nhỏ, chi tiết tinh vi hoặc đánh vần chính xác đôi khi có thể chưa hoàn hảo.

Dữ liệu và tính chính xác thực tế:
Luôn kiểm tra lại độ chính xác của các hình ảnh mang tính dữ liệu, chẳng hạn như sơ đồ hay infographic.

Dịch thuật và bản địa hóa:
Việc tạo văn bản đa ngôn ngữ đôi khi có thể mắc lỗi ngữ pháp hoặc chưa nắm bắt đầy đủ sắc thái văn hóa.

Chỉnh sửa phức tạp và hòa trộn hình ảnh:
Các tác vụ nâng cao như hòa trộn ảnh hoặc thay đổi ánh sáng đôi khi có thể tạo ra những chi tiết không tự nhiên.

Đặc điểm nhân vật:
Mặc dù thường khá ổn định, nhưng mức độ đồng nhất của nhân vật qua nhiều lần chỉnh sửa đôi khi vẫn có thể thay đổi.

V. Thử nghiệm

Propmt 1:

Generate an illustrated scene inspired by a selected chapter of Doraemon. Choose one specific storyline and re-create a single key moment from it.
Render the characters in the expressive Hong Kong wuxia comic style of Huang Yulang and Ma Rong-sheng — dynamic poses, bold ink lines, dramatic shading, and high-energy composition.
Subject & Action

  • Doraemon, Nobita, and other characters involved in the chosen chapter’s main scene.
  • Depict them mid-action based on the selected story moment (ví dụ: đang dùng bảo bối, đang chạy trốn, đang tranh luận…).
    Composition
  • Cinematic panel-style layout.
  • Low-angle or mid-shot composition with strong motion lines.
  • Aspect ratio: 3:2 manga panel.
    Camera & Lighting
  • Dynamic comic lighting with strong contrast, bold shadows, and dramatic highlights.
  • Slight fisheye perspective for heightened motion (optional).
  • Inking style with thick outlines, hand-drawn texture.
    Location
  • Set in the exact location from the story (classroom, sân bóng, nhà Nobita, tương lai, v.v.).
  • Keep recognizable Doraemon universe elements.
    Art Style
  • Hong Kong martial-arts comic aesthetic (黄玉郎 Huang Yulang, 马荣成 Ma Wing-shing / Ma Rong-sheng).
  • Brush-like strokes, heavy black ink, detailed facial expressions, flowing speed lines.
  • Slightly gritty wuxia tone, but keep the characters true to Doraemon’s identity.
    Text & Dialogue
  • Add Vietnamese speech bubbles.
  • Clear, sharp lettering (font sans-serif hoặc comic Việt).
  • Example:
    • Nobita: “Đừng bỏ tớ lại!”
    • Doraemon: “Bình tĩnh, mình có bảo bối đây!”
  • Place text naturally within comic balloons.
    Quality & Format
  • High-resolution 4K illustration.
  • Accurate layout, clean linework.
  • Avoid artifacts or distorted text.
    Factual Constraints
  • Character shapes and designs must remain faithful to Doraemon canon (no off-model anatomy).
  • Story details should match the selected chapter.

Và đây là kết quả:

Nhận xét:

  • Nét bút đậm, mạnh, sắc—rất giống phong cách Huang Yulang / Ma Wing-shing, đặc biệt ở các mảng bóng đổ và hiệu ứng tốc độ.
  • Các đường chuyển động (motion lines) xoáy rất mạnh, tạo cảm giác căng thẳng và hỗn loạn đúng kiểu truyện tranh hành động.
  • Nobita hoảng loạn hết mức, miệng há rộng, mắt chảy nước—rất hài nhưng cũng rất “drama”.
  • Doraemon thì nghiến răng, gương mặt quyết liệt—khác phiên bản nhẹ nhàng thường thấy, nhưng rất hợp phong cách võ hiệp.
  • Shizuka trông kiên quyết và mạnh mẽ hơn bình thường—điểm nhấn thú vị!
  • Các nhân vật vẫn giữ đúng nhận dạng truyền thống, không bị méo hay lạ.
  • Bố cục cực kỳ năng động, gần như vỡ tung trong căn phòng.
    Hiệu ứng xoáy quanh Shizuka và bảng đồ vật Doraemon đang cầm tạo ra nhịp độ rất mạnh.
    Góc nhìn hơi thấp (low-angle nhẹ), giúp tăng cảm giác kịch tính.
  • Màu đậm – nhạt theo kiểu màu nước Hong Kong manhua, pha chút rực rỡ của manga Nhật.
  • Ánh sáng từ bảo bối Doraemon làm điểm sáng trung tâm, kéo mắt người xem ngay lập tức.

Điểm chưa được:

  • Nội dung của ảnh đang không giống logic
  • Text tiếng việt đang vô nghĩa
  • Logic ảnh không phù hợp
  • Quần áo của nhân vật không phù hợp

Propmt 2:

Phong cách & đường nét
Tạo một cảnh hành động lấy cảm hứng từ One Punch Man. Nhân vật gồm: Saitama (tóc trọc, áo choàng bay), Genos (cyborg với cánh tay phát sáng), và một quái vật cấp Dragon đang tàn phá thành phố.

Chủ thể & hành động:
Saitama bước tới rất bình thản giữa chiến trường hỗn loạn, tay giơ nhẹ chuẩn bị tung cú đấm quen thuộc. Genos phía sau đang bắn chùm năng lượng cực mạnh để bảo vệ dân thường. Quái vật khổng lồ ở trung cảnh, đang xoay người né tuyệt vọng trước cú đấm sắp giáng xuống. Các tòa nhà đổ nát, kính vỡ, khói bụi bay tán loạn.

Bố cục & tỷ lệ:
Cinematic 21:9 wide shot, Saitama ở cận trung tâm, quái vật ở trung phải, Genos lệch trái. Tòa nhà đổ tạo đường chéo dẫn mắt về cú đấm.

Camera & ánh sáng:
Low-angle dynamic shot như phim siêu anh hùng. Golden hour backlight từ sau Saitama tạo viền sáng cho đầu và vai. Genos có ánh sáng lạnh xanh từ lõi năng lượng. Khói bụi HDR, ánh sáng khuếch tán, cinematic color grading hơi ngả trắng–teal.

Phong cách:
Manhua Hong Kong đậm chất Huang Yulang & Ma Rong-sheng — nét mực mạnh, hiệu ứng tốc độ, highlight màu nước, chuyển động cực nhanh. Gương mặt exaggerated theo phong cách hài–ngầu của One Punch Man.

Text & hội thoại (tiếng Việt):
Chèn speech bubble rõ nét, font chữ Việt chính xác, đặt vị trí hợp lý:

Saitama: “Ờ… lại nữa hả?”

Genos: “Thưa thầy! Con sẽ yểm trợ!”

Quái vật: “Không! Đừng lại gần!!”

Yêu cầu kỹ thuật:
Render sắc nét 2K hoặc 4K, chuyển động mượt, giữ đúng thiết kế nhân vật nhưng thể hiện theo phong cách võ hiệp Hong Kong, kết hợp hành động manga hiện đại.”

Kết quả:

Điểm mạnh:
Phong cách manhua Hong Kong + chất One Punch Man được thể hiện rất tốt: nét mực mạnh, chuyển động, khói bụi, ánh sáng đẹp.
Bố cục hợp lý: Saitama trung tâm (đúng tinh thần nhân vật chính), Genos trái – quái vật phải.
Màu sắc và ánh sáng khá cinematic, đúng như mô tả trong prompt.
Về tạo hình nhân vật:
Saitama giữ được đúng tính cách: mặt tỉnh bơ, đi bộ giữa hỗn loạn.
Genos đang tấn công, tạo năng lượng xanh đúng đặc trưng.
Quái vật Dragon-class bên phải trông hợp lý, biểu cảm sợ hãi.
=> Tổng thể: Hình đẹp, phong cách đúng, năng lượng mạnh, bố cục tốt.

  1. Vấn đề logic về text trong ảnh:
    Có lỗi thay đổi vị trí/logic người nói, cụ thể: Sai lệch 1: “Ờ… lại nữa hả?”
    → Đây là câu của Saitama (theo prompt).
    Nhưng trong ảnh, nó lại nằm ở phía bên trái, gần Genos, khiến ai nhìn vào sẽ nghĩ Genos nói câu này. Sai lệch 2: “Thưa thầy! Con sẽ yểm trợ!”
    → Đây là câu của Genos.
    Nhưng bubble lại đặt gần Saitama, khiến câu này trông như Saitama đang nói. Sai lệch 3: Câu của quái vật (“Không! Đừng lại gần!!”)
    → Cái này đặt đúng vị trí.

=> Tổng quan:
Cảnh tạo ra đẹp, nhưng AI đảo vị trí text và làm mis-match với người nói.
Đây là lỗi thường gặp khi tạo ảnh có speech bubble.

Propmt 3:

Tạo một cảnh hành động với nhân vật chính là một chú gấu trúc (panda) mang tính cách hài hước nhưng mạnh mẽ.
Chủ thể chính: gấu trúc chiến binh mặc giáp tre, cầm gậy trúc, vừa đáng yêu vừa ngầu.
Hành động: gấu trúc đang thực hiện một cú xoay người tung đòn ‘Tre Long Quyền’, khói bụi xoáy quanh thân.
Bối cảnh: giữa rừng trúc cổ, ánh sáng xuyên qua lá, bụi tre bay trong không khí.
Nhân vật phụ: 2 tiểu hòa thượng gấu trúc đứng phía sau reo hò cổ vũ.

Phong cách: manhua Hong Kong (Huang Yulang & Ma Rong-sheng), nét mực mạnh, hiệu ứng chuyển động mạnh, màu nước pha mực, độ tương phản cao.
Bố cục & tỷ lệ: 16:9 wide shot, gấu trúc ở trung tâm, gậy trúc tạo đường dẫn thị giác từ trái sang phải.

Camera & ánh sáng: low-angle dynamic shot, DOF nông (f/1.8), ánh sáng vàng nhẹ từ sau lưng tạo đường viền highlight quanh nhân vật.
Chèn hội thoại tiếng Việt bằng font comic rõ nét:

Gấu trúc: “Chuẩn bị xem tuyệt kỹ của ta!”
Tiểu hòa thượng 1: “Sư huynh cố lên!!”
Tiểu hòa thượng 2: “Đòn này bá đạo quá!”
Tạo hình mượt, chi tiết cao, 4K.

Kết quả:

  • Text bị sai / typo
    “CHUẨN BỊ CEM TUYỆT KỸ CỦA TA!” → nghi là typo, phải là “CHUẨN BỊ XEM TUYỆT KỸ CỦA TA!” hoặc “CHUẨN BỊ XEM TUYỆT KỸ CỦA TA!”.
  • Người nói & vị trí bubble chưa logic
  • Bubble đôi khi đặt xa nhân vật hoặc ở vị trí khiến người xem hiểu nhầm ai đang nói.
  • Thiếu nhân vật phụ: rõ muốn 2 tiểu hòa thượng nhưng ảnh hiện tại không có (hoặc bị thay bằng những nhân vật khác / bị xoáy đi).
    Tông lời thoại / nội dung chưa khớp hành động
    Một số câu hơi dài/khô, không ăn khớp với hành động (ví dụ gậy tung đòn mà thoại lại không làm rõ “kêu gọi” hay “hào hứng”).

Prompt 4:

A soft, dreamy golden-hour street portrait of a young Japanese woman in a playful POV composition. She raises one hand toward the camera to shield her eyes from the sunlight, creating a natural sun-blocking gesture. Her fingers create soft shadows across her face.

She has a distinctly Japanese appearance, light natural makeup, and Japanese-style hair with airy bangs and slightly messy strands moving in a gentle breeze.

Setting: a Japanese city street during late-afternoon golden hour. Warm sunlight streams from behind her, producing rim light around her hair. Background includes narrow Japanese streets, soft-focus shop signs, subtle storefront lanterns, and creamy bokeh, all slightly blurred to maintain subject focus.

Retro cinematic style with warm tones, vintage film color palette, soft-focus lens effect, light haze, glowing highlights, and a subtle vignette. Her expression is cheerful and authentic, capturing a candid, intimate moment with a nostalgic mood.

Kết quả:

Các lỗi thường gặp trong ảnh đã được tạo
1) Sai chính tả, sai dấu tiếng Việt

Ví dụ: “CEM” thay vì “XEM”.
Lỗi dấu, lỗi ngữ pháp, câu văn không tự nhiên.

2) Thoại thiếu logic hoặc không liên quan

Nhân vật A nói ý A, nhân vật B trả lời ý B không liên quan.
Lời thoại không phù hợp với hành động hoặc cảm xúc trong cảnh.

3) Bubble đặt sai vị trí / không chỉ đúng nhân vật

Bubble ở quá xa nhân vật.
Đuôi bubble không chỉ vào miệng, gây nhầm lẫn ai đang nói.
Bubble che mất chi tiết quan trọng.

4) Nhân vật yêu cầu không xuất hiện đúng

Ví dụ:

Yêu cầu “2 tiểu hòa thượng panda” nhưng ảnh không có.
Các nhân vật Doraemon hoặc One Punch Man đôi khi bị thiếu hoặc biến dạng.

5) Không đúng phong cách minh họa đã yêu cầu

Chưa đúng phong cách Huang Yulang + Ma Rong-sheng: nét mạnh, dứt khoát, bố cục động, phong cách manhua Hong Kong.

6) Lời thoại không nằm đúng bubble / text quá nhỏ

Bubble méo, bố cục sai.
Font tiếng Việt không rõ ràng, không giống comic.
Text bị méo, mờ hoặc khó đọc.

7) Không giữ tính nhất quán giữa các prompt

Dù format giống nhau, hình lại khác tone màu, bố cục, style.
Nhân vật cùng tên nhưng được vẽ khác nhau qua mỗi lần tạo.

Leave a Reply

Your email address will not be published. Required fields are marked *