
Thấy một bức ảnh muốn lấy theo phong cách? Biến nó thành prompt chỉ với một cú nhấp — trình phân tích phong cách của ZOOOP
Bất kỳ ai từng dành thời gian với một trình tạo ảnh AI đều đã trải qua khoảnh khắc này: bạn lướt Pinterest hoặc portfolio của một người bạn, gặp một khung hình mà ánh sáng, bảng màu và bầu không khí đúng y như bạn muốn — và mười phút sau bạn vẫn nhìn chằm chằm vào một ô prompt trống, không thể diễn đạt bất cứ điều gì thành lời.
ZOOOP vừa ra mắt một lối tắt nhỏ cho chuyện đó — trình phân tích phong cách: tải lên một ảnh tham chiếu, đợi vài giây, nhận lại một prompt tiếng Anh gọn gàng. Dán thẳng vào ô nhập, hoặc viết lại đôi ba câu trước khi gửi.
Trình phân tích phong cách thực sự làm gì
Một câu thôi: nó dịch một bức ảnh thành prompt mà mô hình có thể đọc.
Trình phân tích tách bức ảnh theo vài trục:
- Subject (chủ thể) — trong khung có gì: người, đồ vật, chính bối cảnh
- Composition (bố cục) — góc, khoảng cách, đóng khung, sắp đặt
- Style (phong cách) — nhiếp ảnh, minh hoạ, sơn dầu, render 3D, chất phim, v.v.
- Lighting (ánh sáng) — cứng hay mềm, ngược sáng hay thuận sáng, ấm hay lạnh
- Palette (bảng màu) — tông chủ đạo, mối quan hệ giữa các màu, độ bão hoà
- Mood (tâm trạng) — nốt cảm xúc: yên tĩnh, căng thẳng, ấm áp, cô đơn
Sau đó dệt tất cả thành một đoạn văn tiếng Anh duy nhất, giới hạn khoảng 120 từ. Vì sao tiếng Anh — các mô hình tạo ảnh hiện tại vẫn được tinh chỉnh mịn hơn rất nhiều với prompt tiếng Anh; ngay cả tiếng Việt viết tốt cũng loãng đi ở bước dịch ngầm. Nói thẳng bằng ngôn ngữ mà mô hình được huấn luyện sẽ khiến kết quả ổn định hơn hẳn.
Kết quả trông ra sao
Các trục bên trên còn trừu tượng cho đến khi bạn nhìn chúng trên một bức ảnh thật. Hãy hình dung bạn tải lên một bức ảnh "hoàng hôn ở Tokyo, một người đơn độc cầm ô đen bước qua con phố ướt, ánh đèn neon phản chiếu trong vũng nước". Kết quả có cấu trúc mà bạn nhận lại trông đại khái như sau:
- Subject — a lone figure with a black umbrella walking down a rain-slicked street
- Composition — low-angle shot, centered subject, leading lines from neon signs
- Style — cinematic photography, subtle film grain, anamorphic flare
- Lighting — rim lighting from neon, soft ambient fill, cool dominant with warm accents
- Palette — deep teal and magenta, warm amber highlights from puddles
- Mood — melancholic, contemplative, urban solitude
- Camera — 35mm anamorphic lens, shallow depth of field
Bên dưới có một Overall Description — các trục đó được dệt lại thành một prompt tiếng Anh liền mạch. Chính đoạn này mới thật sự rơi vào ô nhập của trình tạo; các trục được tách bên trên giống như phần "đây là vì sao prompt nói như thế", để bạn nhặt và sửa từng phần.
Lợi thế của cách trình bày này: bạn có thể khoá từng trục một. Muốn giữ toàn bộ bố cục và bầu không khí, nhưng đổi ánh sáng thành ánh sáng bình minh dịu nhẹ? Chỉ đổi dòng Lighting, thay câu tương ứng trong Overall Description, phần còn lại giữ nguyên. Nhanh hơn nhiều so với viết lại từ đầu.
Tìm ở đâu
Trình phân tích phong cách xuất hiện ở hai nơi bên trong ZOOOP:
- Phía trên ô prompt ở bất kỳ trình tạo nào — mở công cụ trình tạo ảnh AI hoặc trình tạo video AI, đính kèm một ảnh tham chiếu, một nút "Describe style" sẽ xuất hiện phía trên ô nhập prompt.
- Bên trong canvas — canvas tạo sinh có cùng nút đó trên thanh prompt. Hữu ích trong các luồng nhiều cảnh: phân tích một ảnh tham chiếu, dùng lại cùng một dáng vẻ cho mười cảnh.
Bấm, đợi vài giây, ô prompt tự lấp đầy. Gửi như đang có, hoặc viết lại một câu trước khi đi. Đó là điểm xuất phát, không phải vạch đích.
Khi nào nên dùng (và khi nào không)
Hợp:
- Bạn thấy một ảnh tham chiếu mà bạn rất thích nhưng không nói được vì sao — để trình phân tích nói thay.
- Bạn muốn một diện mạo nhất quán trên cả một dải cảnh — phân tích ảnh tham chiếu đầu tiên, dán cùng mô tả vào tất cả các cảnh còn lại.
- Bạn bí khi viết prompt và cần một góc khác để gỡ ra.
- Bạn muốn chuyển ngôn ngữ thị giác của một bức ảnh hay tranh vẽ sang một chủ thể mới — ví dụ, lấy không khí của một ảnh tĩnh trong phim áp vào cảnh nhân vật của riêng bạn.
Không phải công cụ phù hợp cho:
- Sao chép từng pixel. Trình phân tích phong cách làm chuyển phong cách, không phải sao chép chính xác. Nếu cần chỉnh sửa trung thành một ảnh đã có, hãy dùng chỉnh sửa ảnh AI.
- Ảnh có nhiều chữ. Trình phân tích cố ý không chép lại văn bản trong ảnh — biển hiệu, áp phích, chú thích đều bị bỏ qua. Đây là chủ ý, để tránh đọc nhầm.
- Người thật có thể nhận diện. Vì lý do quyền riêng tư, không có cái tên nào được đưa ra, chỉ mô tả các đặc điểm có thể quan sát như "một phụ nữ ngoài ba mươi, tóc đen dài thẳng".
Vài thói quen đáng có
Viết prompt giống nấu ăn — có người theo công thức, có người nêm theo khẩu vị. Trình phân tích đưa cho bạn công thức; bạn quyết định bám sát đến đâu.
Sửa đi, đừng dán mù. Đầu ra là một mô tả liền mạch. Liếc qua; câu nào không vừa, cắt đi. Trình phân tích có thể viết "at dusk" trong khi bạn muốn "at dawn" — đổi đúng một từ đó.
Để phối: phân tích riêng. Nếu muốn lấy ánh sáng từ ảnh A và bố cục từ ảnh B, đưa lần lượt từng ảnh qua trình phân tích rồi ghép câu bằng tay. Kiểm soát tốt hơn nhiều so với việc bắt mô hình nhìn cả hai cùng lúc.
Đừng dịch ngược tiếng Anh. Mô hình hoạt động tốt nhất khi được cho ăn trực tiếp tiếng Anh — không cần đọc từng chữ. Nếu muốn kiểm tra ý, đưa qua trình dịch, nhưng đừng viết lại sang tiếng Việt trước khi gửi.
Một lưu ý nhỏ
Trình phân tích phong cách tiêu một lượng nhỏ tín dụng mỗi lượt chạy — đủ nhẹ để dùng thoải mái — và tự động hoàn lại khi gặp lỗi. Nó chạy trên cùng hạ tầng với phần còn lại của tạo ảnh AI và tạo video AI, nên tốc độ và độ tin cậy đi cùng nhịp với các công cụ chính.
Phiên bản thật lòng của tất cả những điều này: nút thắt cổ chai trong công việc với ảnh AI thường không phải là mô hình — mà là "tôi thực sự muốn gì" rất khó nói thành lời. Trình phân tích phong cách giúp đúng ở bước đó. Nó biến một sự thích mơ hồ thành một mô tả cụ thể, phần còn lại để mô hình lo.
Lần sau khi lướt qua một thứ mà bạn muốn lặp lại cảm giác của nó, đừng cố gò vào câu chữ nữa. Quăng nó vào trình tạo ảnh AI hoặc canvas tạo sinh, bấm nút, xem cái gì quay về.