کاربرد این تمپلت n8n چیست ؟
یک پزشک در مطب خصوصی: هنگام معاینه بیمار نیاز به یادداشتبرداری سریع دارد. کافی است بگوید «Hey Siri, take a note» و تشخیص و داروهای تجویزی را دیکته کند. Siri صدا را به متن تبدیل کرده و به n8n ارسال میکند. AI Agent متن را ساختاریافته و در گوگل شیت یا دیتابیس ذخیره میکند. پزشک بدون لمس گوشی، پروندهسازی خودکار انجام میدهد.
کاربرد بهینه و پیشرفته دستیار صوتی هوشمند با Hey Siri و n8n
کاربرد پیشرفته: میتوان به AI Agent ابزار (Tool) اختصاصی متصل کرد. مثلاً با گفتن «Hey Siri, what's my schedule today» دستیار به گوگل تقویم متصل شده و برنامه روزانه را مرور میکند. همچنین میتوان از حافظه (Memory) استفاده کرد تا مکالمات چندمرحلهای حفظ شوند. با اضافه کردن نودهای بیشتر، میتوان به پایگاه داده مشتریان متصل شد و سفارشها را با فرمان صوتی ثبت کرد.
نود های استفاده شده در دستیار صوتی هوشمند با Hey Siri و n8n
در این بخش از همیار Ai تمامی نود های استفاده شده در تمپلت n8n دستیار صوتی هوشمند با Hey Siri و n8n بترتیب قرار گرفتن در ورک فلو بهمراه توضیحات و جایگزین های دیگر جهت توسعه بر اساس نیاز شما قرار گرفته است
مرحله 1 : دریافتکننده درخواست از اپل شورتکات
نوع نود : n8n-nodes-base.webhook
چرا از این نود اینجا قرار گرفته ؟
دریافت دادههای ورودی ارسالشده از اپل شورتکات از طریق متد POST
چرا از این نود استفاده کردیم ؟
به عنوان نقطه ورود گردش کار، درخواست HTTP حاوی متن تبدیلشده از گفتار را دریافت و به گره بعدی ارسال میکند.
از این نود دیگه کجاها استفاده میشه ؟
- دریافت فرمان صوتی از دستیار گوگل و پردازش در n8n
- اتصال سنسورهای اینترنت اشیاء به n8n از طریق Webhook
- دریافت خودکار گزارشهای روزانه از رباتهای تلگرام
بجای این نود میتونم از چی استفاده کنم ؟
تریگر IMAPاگر فرمان از طریق ایمیل ارسال شود، میتوان به جای Webhook از تریگر ایمیل استفاده کرد.
تریگر تلگرامدریافت پیام متنی از ربات تلگرام و استفاده از آن به عنوان ورودی دستیار صوتی.
مرحله 2 : عامل هوشمند هوش مصنوعی
نوع نود : n8n-nodes-base.noOp
چرا از این نود اینجا قرار گرفته ؟
پردازش متن ورودی کاربر با استفاده از مدل زبانی و تولید پاسخ هوشمند
چرا از این نود استفاده کردیم ؟
به هسته هوشمند گردش کار تبدیل میشود و با درک متن ورودی، پاسخی مختصر و مناسب برای خواندن توسط سیری تولید میکند.
از این نود دیگه کجاها استفاده میشه ؟
- ربات پشتیبانی مشتری که به سوالات متداول پاسخ میدهد
- مشاور مالی که وضعیت بورس را تحلیل و خلاصه میکند
- دستیار برنامهریزی که قرار ملاقاتها را در تقویم ثبت میکند
بجای این نود میتونم از چی استفاده کنم ؟
نود Anthropic Chat Modelاستفاده از مدل Claude به جای GPT-4o-mini برای پاسخهای تحلیلیتر و طولانیتر
نود Groq Chat Modelجایگزین رایگان و سریع برای مدلهای LLaMA با نرخ بالای توکن در ثانیه
مرحله 3 : پاسخ به اپل شورتکات
نوع نود : n8n-nodes-base.respondToWebhook
چرا از این نود اینجا قرار گرفته ؟
ارسال پاسخ تولیدشده توسط هوش مصنوعی به اپل شورتکات
چرا از این نود استفاده کردیم ؟
برای بستن حلقه ارتباطی و ارسال نتیجه پردازش به دستگاه کاربر ضروری است تا سیری بتواند پاسخ را با صدای بلند بخواند.
از این نود دیگه کجاها استفاده میشه ؟
- ارسال تأییدیه ثبت سفارش به درگاه پرداخت
- بازگرداندن نتایج جستجو به ربات تلگرام
- ارسال خروجی محاسبات به فرم وب
بجای این نود میتونم از چی استفاده کنم ؟
نود HTTP Requestاگر سرویس مقصد نیاز به ارسال پاسخ به آدرس دیگری داشته باشد، میتوان از این نود استفاده کرد.
نود Emailدر صورت نیاز به ارسال نتیجه از طریق ایمیل به جای پاسخ بلادرنگ
سوالات متداول
چطور میتوانم از این گردش کار روی گوشی آیفون استفاده کنم؟
بعد از فعالسازی گردش کار در n8n، لینک Apple Shortcut موجود در یادداشت چسبان را دانلود و نصب کنید. سپس داخل اپلیکیشن Shortcuts، آدرس Webhook را با Production URL کپیشده از نود Webhook جایگزین کنید. حالا با گفتن «Hey Siri, AI Agent» فرمان خود را بگویید.
آیا استفاده از OpenAI هزینه دارد؟
بله، مدل GPT-4o-mini پولی است اما بسیار مقرونبهصرفه است. اگر به دنبال جایگزین رایگان هستید، میتوانید نود OpenAI را حذف و به جای آن از نود Groq با حساب رایگان استفاده کنید که مدل LLaMA را به صورت رایگان ارائه میدهد.
چطور میتوانم به دستیار صوتی حافظه بدهم تا مکالمه را حفظ کند؟
میتوانید از نود Memory یا Window Buffer Memory در تنظیمات AI Agent استفاده کنید. همچنین میتوانید با ذخیره تاریخچه مکالمه در Airtable یا Redis و بازیابی آن در هر بار اجرا، یک حافظه طولانیمدت سفارشی بسازید.
آیا میشود به جای OpenAI از مدل فارسیزبان استفاده کرد؟
بله، با جایگزینی نود OpenAI با نود Hugging Face Inference Model و استفاده از مدلهای فارسی مانند 'Persian-LLaMA' یا 'gemma-2-27b-it-fa' میتوانید پاسخهایی به زبان فارسی دریافت کنید. همچنین میتوانید از Groq با مدل LLaMA که تا حدی از فارسی پشتیبانی میکند، استفاده کنید.
چطور میتوانم اطلاعات بیشتری مثل موقعیت مکانی یا آب و هوا را در اختیار AI Agent قرار دهم؟
میتوانید یک نود HTTP Request قبل از AI Agent اضافه کنید که به یک API آب و هوا متصل میشود. سپس خروجی آن را به همراه متن کاربر در بخش Prompt به مدل بدهید. به این ترتیب مدل آگاه به موقعیت و شرایط جوی پاسخ میدهد.