Image to Caption ง่ายนิดเดียว ด้วย Gemini บน n8n
เปลี่ยนภาพให้กลายเป็นคำบรรยายแบบมืออาชีพ ด้วย AI และระบบอัตโนมัติ
ในยุคที่ AI และระบบ Automation เข้ามาช่วยลดภาระงานซ้ำๆ ได้อย่างมหาศาล หนึ่งในไอเดียที่น่าสนใจคือ “การเปลี่ยนภาพให้กลายเป็นคำบรรยาย (caption)” แบบอัตโนมัติ บทความนี้จะแชร์ให้เห็นภาพจริงผ่าน n8n ร่วมกับ Gemini API ซึ่งจะช่วยให้คุณสร้าง caption จากรูปภาพ และโพสต์ลง Facebook โดยไม่ต้องลงมือเองแม้แต่นิดเดียว!
โครงสร้าง Workflow
มาดูขั้นตอนการทำงานแต่ละส่วนตามภาพ Workflow:
1. Schedule Trigger
ตั้งเวลาให้ Workflow ทำงานอัตโนมัติ เช่น ทุกวันตอน 9 โมงเช้า
2. Set Date
ตั้งค่าต่างๆ เช่น วันที่ เพื่อใช้ในการค้นหาไฟล์
return [
{
json: {
query: {
startDate: new Date().toISOString().slice(0, 10)
}
}
}
];
3. Google Drive Search
ค้นหาไฟล์ภาพในโฟลเดอร์ที่กำหนด
ในขั้นตอนนี้ เราใช้ Node ชื่อว่า Google Drive → Search เพื่อค้นหาไฟล์ภาพ (เช่น .jpg, .png) ภายในโฟลเดอร์ที่ระบุไว้
✅ สิ่งที่ต้องตั้งค่า:
- Resource: File/Folder
- Operation: Search
- Search Method: Advanced Search
- Query String:
modifiedTime > '{{ $json.query.startDate }}'and trashed = false and mimeType contains 'image/'
- Limit: 1
- Filter:
From list: Folder
4. Google Drive Download
ดาวน์โหลดภาพจาก Google Drive เพื่อนำไปใช้งานต่อใน Workflow
หลังจากที่เราค้นพบภาพจากขั้นตอนก่อนหน้านี้แล้ว เราจะใช้ Node Google Drive → Download เพื่อ ดาวน์โหลดเนื้อหาของไฟล์ภาพ มาใช้ในขั้นตอนต่อๆ ไป (เช่น ส่งเข้า Gemini API)
✅ สิ่งที่ต้องตั้งค่า:
- File ID: นำมาจากผลลัพธ์ของ Google Drive Search
- Options–> Name: ตั้งชื่อ เช่น data, image, หรืออะไรก็ได้ตามต้องการ (จะถูกใช้ใน node ถัดไป)
5. Move Binary Data
แปลงข้อมูล Binary เป็น JSON เพื่อส่งต่อไปยัง Gemini
6. Gemini Image to Caption
ใช้ Gemini API วิเคราะห์ภาพ และสร้างคำบรรยายอัตโนมัติ
ในขั้นตอนนี้ เราจะส่งภาพที่ได้จาก Google Drive (ในรูปแบบ binary) ไปให้ Gemini API เพื่อให้ AI ช่วย “ดูภาพ” แล้วเขียนคำอธิบายออกมาในรูปแบบข้อความ
ใช้ node ประเภทอะไร?
ใน n8n เราใช้ HTTP Request Node เพื่อเรียกใช้งาน Gemini API ของ Google (หรือผ่าน Vertex AI endpoint ก็ได้)
✅การตั้งค่า HTTP Request Node:
- Method: POST
- Send Query Parameters:
Specify Query Parameters: Using Fields Below- Query Parameters:
- Name: Key
- Value: [key-Gemini]
- Send Headers:
Specify Headers: Using Fields Below
Header Parameters- Name: Content-Type
- Value: application/json
- Send Body:
Body Content Type: JSON
Specify Body: Using JSON
JSON:{ "contents": [ { "parts": [ { "text": "ช่วยเขียนแคปชั่นเท่ ๆ สำหรับโพสต์ขายสินค้าแฟชั่น บน Facebook พร้อมแฮชแท็ก โดยขอแค่ 1 คำตอบเท่านั้น" }, { "inline_data": { "mime_type": "image/jpeg", "data": "{{ $json.data }}" } } ] } ] }
7. Get Image
ดึงลิงก์ภาพจาก Google Drive มาใช้งานสำหรับโพสต์ต่อ (เช่น Facebook)
หลังจากที่เราดาวน์โหลดภาพจาก Google Drive แล้ว (ในขั้นตอนที่ 4) และประมวลผลด้วย Gemini (ข้อ 6) แล้ว เราจะต้อง เตรียม URL ของภาพ เพื่อให้ระบบภายนอก (เช่น Facebook API) สามารถเข้าถึงไฟล์ภาพนั้นได้
✅การตั้งค่า HTTP Request Node:
- Method: Get
- URL: https://www.googleapis.com/drive/v3/files/{{ID-รูปภาพ}}?alt=media
- Authentication: Generic Credential Type
- Generic Auth Type: OAuth2 API
- OAuth2 API: OAuth API Google Drive ของคุณ
- Options: Response
- Response Format: File
- Put Output in Field: data
8. Post to Facebook
โพสต์ภาพจาก Google Drive พร้อมคำบรรยาย (caption) จาก Gemini ลงบนเพจ Facebook โดยอัตโนมัติ
วัตถุประสงค์:
- นำภาพ (ที่ได้จาก Google Drive → get image)
- นำ caption (ที่ได้จาก Gemini → image to caption)
- ส่งไปโพสต์บนเพจ Facebook ผ่าน Facebook Graph API
✅การตั้งค่า HTTP Request Node
- Method:
- https://graph.facebook.com/v22.0/(id-page)/photos
- Send Body:
- Body Content Type: Form-Data
- Parameter Type: From Data
- Name: access_token
- Value: (Key-Facebook-graph)
- Parameter Type: Form Data
- Name: caption
- Value: {{ $json.candidates[0].content.parts[0].text }}
- Parameter Type: n8n Binary File
- Name: image
- Input Data Field Name: data
ภาพตัวอย่างการโพสต์ลง Facebook ของ workflow นี้
จุดเด่นของระบบนี้
✅ อัตโนมัติ 100%
✅ ใช้ AI ช่วยคิด caption
✅ ไม่ต้องเขียนโค้ดเอง
✅ ขยายต่อยอดได้ง่าย เช่น ส่งเข้า LINE, Discord, หรือเก็บใน Airtable
สรุป
Image to Caption ไม่ใช่แค่เรื่องของความสะดวก แต่มันคือการเปิดประตูสู่โลกใหม่ของ “Content Automation” ด้วย n8n และ Gemini API คุณสามารถสร้างระบบที่ทำงานแทนคุณได้ทุกวัน โดยไม่ต้องเหนื่อยเลยแม้แต่นิดเดียว
บริการของเรา: https://www.novelbiz.co.th/services/
Youtube: https://youtu.be/_ABQDSUSWMg?si=WvjfP6a1XZ6MnLF1