ปรับใช้ AI และการเรียนรู้ของเครื่องที่ทรงพลังและมีประสิทธิภาพอย่างรวดเร็วโดยใช้ MCU ของ Renesas RA8M1

By เคนตัน วิลลิสตัน

Contributed By DigiKey's North American Editors

2024-03-20

การเพิ่มขึ้นของปัญญาประดิษฐ์ (AI) การเรียนรู้ของเครื่อง (ML) และเวิร์กโหลดที่เน้นการประมวลผลอื่น ๆ ที่ขอบเครือข่ายสำหรับ Internet of Things (IoT) กำลังเพิ่มภาระการประมวลผลเพิ่มเติมให้กับไมโครคอนโทรลเลอร์ (MCU) การจัดการเวิร์กโหลดใหม่เหล่านี้จะเพิ่มการใช้พลังงาน แม้ว่านักออกแบบจะถูกขอให้ลดพลังงานให้เหลือน้อยที่สุดและเร่งเวลาออกสู่ตลาดก็ตาม

นักออกแบบต้องการตัวเลือกการประมวลผลที่ยังคงประสิทธิภาพของ MCU ไว้ ในขณะเดียวกันก็เพิ่มฟีเจอร์ประสิทธิภาพสูงที่ปรับแต่งมาโดยเฉพาะสำหรับกรณีการใช้งานที่ใช้พลังงานต่ำ ตัวเลือกนี้ควรรักษาโมเดลการใช้งานแบบง่ายที่เกี่ยวข้องกับ MCU แบบดั้งเดิม ในขณะที่เพิ่มคุณสมบัติที่เพียงพอเพื่อรองรับแอปพลิเคชันที่ซับซ้อนที่เปิดใช้งานโดย AI และ ML เช่น การควบคุมด้วยเสียง และการบำรุงรักษาเชิงคาดการณ์

บทความนี้กล่าวถึงปัจจัยที่ผลักดันความต้องการ AI และ ML และอธิบายว่าเหตุใดสถาปัตยกรรมโปรเซสเซอร์ใหม่จึงมีความจำเป็นเพื่อมอบความสามารถเหล่านี้อย่างมีประสิทธิภาพ จากนั้นจะแนะนำ RA8M1 แฟมิลี MCU จากRenesas และแสดงให้เห็นว่าสามารถใช้เพื่อตอบสนองข้อกำหนดเหล่านี้ได้อย่างไร

ข้อกำหนดของ Edge AI และ ML

ความต้องการ AI และ ML กำลังเพิ่มขึ้นในการใช้งาน Edge IoT ตั้งแต่ระบบอัตโนมัติในอาคารและอุปกรณ์อุตสาหกรรมไปจนถึงเครื่องใช้ในบ้าน แม้แต่ระบบฝังตัวที่มีขนาดค่อนข้างเล็กและใช้พลังงานต่ำก็ได้รับมอบหมายให้ดูแลปริมาณงานต่าง ๆ เช่น การจำแนกคีย์เวิร์ด การควบคุมคำสั่งเสียง และการประมวลผลเสียง/ภาพ การใช้งานที่เป็นเป้าหมาย ได้แก่ ฮับเซ็นเซอร์ ระบบนำทางและควบคุมด้วยโดรน วัตถุเสมือน (Augmented Reality-AR) ความเป็นจริงเสมือน (Virtual Reality-VR) และอุปกรณ์สื่อสาร

เพื่อลดการใช้พลังงาน ค่าใช้จ่าย และเวลาแฝง ในขณะเดียวกันก็รับประกันความเป็นส่วนตัว การประมวลผลข้อมูลที่ Edge มักนิยมมากกว่าการส่งไปยังระบบคลาวด์ นี่ถือเป็นความท้าทายสำหรับนักออกแบบ เนื่องจากอุปกรณ์ Edge มักมีข้อจำกัดด้านทรัพยากร โดยเฉพาะอย่างยิ่งเมื่อใช้พลังงานจากแบตเตอรี่

MCU ที่ได้รับการปรับปรุงสำหรับการประมวลผลแบบ Edge

โดยทั่วไปปริมาณงาน AI และ ML เกี่ยวข้องกับการดำเนินการทางคณิตศาสตร์เดียวกันซ้ำ ๆ ในชุดข้อมูลขนาดใหญ่ ปริมาณงานเหล่านี้รองรับการเร่งความเร็วโดยใช้คำสั่งเดียว การประมวลผลหลายข้อมูล (SIMD) SIMD ดำเนินการทางคณิตศาสตร์หลายอย่างพร้อมกัน โดยให้ปริมาณงานที่สูงขึ้นมากและประสิทธิภาพการใช้พลังงานที่ดีกว่าการประมวลผลแบบเดิม

เนื่องจาก MCU แบบดั้งเดิมไม่มีฟังก์ชัน SIMD จึงต้องการความช่วยเหลือในการรันเวิร์กโหลด AI และ ML วิธีแก้ปัญหาหนึ่งคือการใช้ตัวประมวลผลสัญญาณดิจิทัล (DSP) หรือตัวเร่งความเร็ว SIMD อื่นๆ ควบคู่ไปกับ MCU อย่างไรก็ตาม วิธีการใช้โปรเซสเซอร์หลายตัวนี้ทำให้การออกแบบระบบมีความซับซ้อน

อีกทางเลือกหนึ่งคือการเปลี่ยนไปใช้ไมโครโปรเซสเซอร์ประสิทธิภาพสูง (MPU) ที่ติดตั้งความสามารถของ SIMD สิ่งนี้สามารถมอบประสิทธิภาพที่จำเป็นในการตั้งค่าโปรเซสเซอร์ตัวเดียว แต่ MPU ก็มีข้อเสียในด้านการใช้พลังงานและชุดคุณสมบัติ ตัวอย่างเช่น ไม่ใช่ทุก MPU ที่ได้รับการออกแบบมาเพื่อมอบการประมวลผลตามที่กำหนดและมีความหน่วงต่ำซึ่งจำเป็นในแอปพลิเคชันที่เน้น MCU

การเปิดใช้งาน AI และ ML ใน MCU

Renesas ตระหนักถึงความจำเป็นในการใช้ชุด MCU ที่ได้รับการปรับปรุงเพื่อรองรับปริมาณงาน AI และ ML จึงได้เปิดตัว MCU ซีรีส์ RA8M1 (รูปที่ 1) ซีรีส์เรื่องนี้มีพื้นฐานมาจาก Arm® สถาปัตยกรรม Cortex®-M85 พร้อมฮีเลียมและ TrustZone และสามารถทำงานได้ที่ 480 เมกะเฮิรตซ์ (MHz) โดยใช้พลังงานโดยทั่วไปที่ 225 ไมโครแอมแปร์ต่อเมกะเฮิรตซ์ (µA/MHz)

รูปที่ 1: MCU Renesas RA8M1 มีพื้นฐานมาจาก Arm Cortex-M85 และมีเทคโนโลยีฮีเลียมเพื่อเร่งการประมวลผล AI และ ML (แหล่งรูปภาพ: Renesas)

ออกแบบมาเพื่อประสิทธิภาพที่มีประสิทธิภาพและการใช้พลังงานต่ำ MCU RA8M1 มีคุณสมบัติต่าง ๆ เช่น การกำหนด ระยะเวลาการขัดจังหวะที่สั้น และการสนับสนุนการจัดการพลังงานที่ล้ำสมัย โปรเซสเซอร์บรรลุประสิทธิภาพการทำงานที่ 6.39 CoreMark ต่อเมกะเฮิรตซ์ (CoreMark/MHz)

ฮีเลียมคือ SIMD M-Profile Vector Extension (MVE) ที่ช่วยเร่งการประมวลผลสัญญาณและ ML ได้อย่างมาก เพิ่มคำสั่งสเกลาร์และเวกเตอร์ 150 คำสั่ง และเปิดใช้งานการประมวลผลรีจิสเตอร์ 128 บิต (รูปที่ 2) ได้รับการปรับให้เหมาะสมสำหรับไมโครคอนโทรลเลอร์ที่มีทรัพยากรจำกัดและใช้พลังงานต่ำ ตัวอย่างเช่น ฮีเลียมนำรีจิสเตอร์หน่วยจุดลอยตัว (FPU) กลับมาใช้ใหม่ แทนที่จะใช้รีจิสเตอร์ SIMD ใหม่ ซึ่งจะช่วยลดการใช้พลังงานของโปรเซสเซอร์และลดความซับซ้อนในการออกแบบ

แผนภาพของฮีเลียมนำธนาคารทะเบียน FPU มาใช้ซ้ำสำหรับการประมวลผลเวกเตอร์ รูปที่ 2: ฮีเลียมนำธนาคารทะเบียน FPU มาใช้ใหม่สำหรับการประมวลผลเวกเตอร์ (แหล่งรูปภาพ: Arm)

ดังที่แสดงในรูปที่ 3 Cortex-M85 ของ RA8M1 มีเทคโนโลยี TrustZone ของ Arm TrustZone ให้การแยกฮาร์ดแวร์สำหรับเฟิร์มแวร์ ทรัพย์สิน และข้อมูลส่วนตัวที่สำคัญ Cortex-M85 ยังเพิ่มความสามารถด้านความปลอดภัยใหม่ เช่น การรับรองความถูกต้องของตัวชี้และส่วนขยายการระบุเป้าหมายสาขา (PACBTI) คุณลักษณะด้านความปลอดภัยเหล่านี้มีคุณค่าอย่างยิ่งในบริบทของ AI ซึ่งอุปกรณ์อาจโต้ตอบกับข้อมูลส่วนบุคคล

รูปภาพ TrustZone ของ Arm Cortex-M85 รูปที่ 3: TrustZone ของ Cortex-M85 มีการแยกฮาร์ดแวร์สำหรับเฟิร์มแวร์ ทรัพย์สิน และข้อมูลส่วนตัวที่สำคัญ (แหล่งรูปภาพ: Arm)

คุณสมบัติฮาร์ดแวร์ที่ควรมองหาใน MCU ที่รองรับ AI

MCU ควรรวมประสิทธิภาพที่มีประสิทธิภาพเข้ากับชุดคุณลักษณะที่แข็งแกร่งเพื่อรองรับการใช้งาน AI RA8M1 มีอุปกรณ์ครบครันสำหรับการควบคุมมอเตอร์ การควบคุมลอจิกที่ตั้งโปรแกรมได้ (PLC) การสูบจ่าย และการใช้งานด้านอุตสาหกรรมและ IoT อื่น ๆ

ตัวอย่างเช่น อัลกอริธึม AI ต้องใช้หน่วยความจำจำนวนมาก หน่วยความจำระบบ RA8M1 ประกอบด้วยแฟลชสูงสุด 2 เมกะไบต์ (Mbytes) และ SRAM 1 Mbyte SRAM ประกอบด้วยหน่วยความจำคู่แน่น (TCM) ขนาด 128 กิโลไบต์ (Kbytes) ซึ่งช่วยให้สามารถเข้าถึงหน่วยความจำได้อย่างรวดเร็วสำหรับการคำนวณที่มีประสิทธิภาพสูง

เพื่อให้มั่นใจถึงการทำงานที่เชื่อถือได้ SRAM ผู้ใช้ขนาด 384 Kbytes และ TCM ขนาด 128 Kbytes ทั้งหมดได้รับการกำหนดค่าเป็นหน่วยความจำรหัสแก้ไขข้อผิดพลาด (ECC) คำสั่ง 32 Kbyte และแคชข้อมูล (data caches) ยังได้รับการป้องกัน ECC อีกด้วย

RA8M1 รวมคุณสมบัติความปลอดภัยหลายประการ นอกเหนือจากที่รวมอยู่ใน Arm core ซึ่งรวมถึงกลไกการเข้ารหัสทรัพย์สินทางปัญญาที่ปลอดภัยที่สามารถตั้งโปรแกรมใหม่ได้ (RSIP) สำหรับการประมวลผลข้อมูลที่ปลอดภัย พื้นที่จัดเก็บข้อมูลที่ไม่เปลี่ยนรูปสำหรับการปกป้องข้อมูลที่สำคัญ และกลไกป้องกันการโจรกรรม

สำหรับอินเทอร์เฟซการสื่อสาร MCU มีอีเทอร์เน็ตสำหรับการเชื่อมต่อเครือข่าย, Controller Area Network Flexible Data Rate (CAN FD) สำหรับการใช้งานในยานยนต์และอุตสาหกรรม และ USB ความเร็วสูง/ความเร็วเต็มสำหรับการเชื่อมต่อทั่วไป นอกจากนี้ยังรวมอินเทอร์เฟซของกล้องและอินเทอร์เฟซ Serial Peripheral Interface (SPI) ฐานแปดพร้อมการถอดรหัสได้ทันทีสำหรับหน่วยความจำภายนอก

อินเทอร์เฟซแบบอะนาล็อกประกอบด้วยตัวแปลงอนาล็อกเป็นดิจิตอล (ADC) 12 บิต และตัวแปลงดิจิตอลเป็นอนาล็อก (DAC) ตัวเปรียบเทียบอนาล็อกความเร็วสูง และวงจรตัวอย่างและพักสามวงจร สำหรับการสื่อสารแบบอนุกรม RA8M1 รองรับหลายโปรโตคอล รวมถึงโหมด Serial Communication Interface (SCI) พร้อม SPI, Universal Asynchronous Receiver/Transmitter (UART) และ Inter-Integrated Circuit (I²C) MCU ยังนำเสนอวงจรอินเตอร์อินทิเกรต (I3C) ที่ปรับปรุงแล้วเพื่อเพิ่มอัตราการถ่ายโอนข้อมูลและประสิทธิภาพ

นักพัฒนาที่ต้องการเข้าถึงความสามารถอินพุต/เอาท์พุต (I/O) เหล่านี้อย่างเต็มที่ สามารถใช้แพ็คเกจ Ball Grid Array (BGA) เช่น 224 พิน R7FA8M1AHECBD#UC0 . ผู้ที่มองหาการออกแบบและกระบวนการประกอบแผงวงจรพิมพ์ (บอร์ดพีซี) ที่มีความคล่องตัวมากขึ้นอาจพิจารณาใช้ตัวเลือกแพ็คเกจสี่แบนราบ (LQFP) แบบ low-profile เช่น 144 พิน R7FA8M1AHECFB#AA0 .

สภาพแวดล้อมการพัฒนาสำหรับการใช้งาน AI

นักออกแบบที่สนใจทดลองใช้ซีรีส์ RA8M1 สามารถเริ่มต้นด้วยบอร์ดทดลอง EK-RA8M1 R7FA8M (รูปที่ 4) บอร์ดนี้ประกอบด้วยอินเทอร์เฟซอีเทอร์เน็ต RJ45 RMII, อินเทอร์เฟซโฮสต์และอุปกรณ์ USB ความเร็วสูง และส่วนหัว CAN FD สามพิน สำหรับหน่วยความจำ มีแฟลช SPI ฐานแปดขนาด 64 Mbytes

รูปที่ 4: บอร์ดทดลอง EK-RA8M1 รองรับ I/O ที่แข็งแกร่งเพื่อใช้ RA8M1 MCU (แหล่งรูปภาพ: Renesas)

RA8M1 ได้รับการสนับสนุนโดย Renesas Flexible Software Package (FSP) ซึ่งเป็นเฟรมเวิร์กที่ครอบคลุมซึ่งออกแบบมาเพื่อมอบฐานซอฟต์แวร์คุณภาพสูงที่ใช้งานง่าย ปรับขนาดได้ และมีคุณภาพสูงสำหรับการออกแบบระบบฝังตัว

แพ็คเกจนี้มีเครื่องมือในการพัฒนารวมถึง e² studio สภาพแวดล้อมการพัฒนาแบบรวม (IDE) ที่ใช้ Eclipse IDE ยอดนิยม นอกจากนี้ยังมีระบบปฏิบัติการแบบเรียลไทม์ที่โดดเด่นและไร้ค่าลิขสิทธิ์อีก 2 ระบบ ได้แก่ Azure RTOS และ FreeRTOS

แพคเกจนี้ประกอบด้วยไดรเวอร์น้ำหนักเบาและพร้อมใช้งานจริง ซึ่งรองรับกรณีการใช้งานทั่วไปในระบบฝังตัว เมื่อใช้ร่วมกับบอร์ดทดลอง ไดรเวอร์เหล่านี้จะช่วยให้นักพัฒนามีเส้นทางที่รวดเร็วในการทดลองกับ RA8M1 I/O

สรุป

RA8M1 ช่วยให้นักพัฒนามีทางเลือกใหม่ในการใช้งานเวิร์กโหลด AI และ ML ในการใช้งาน Edge IoT ซึ่งช่วยประหยัดพลังงาน เพิ่มประสิทธิภาพ ลดความซับซ้อน และลดระยะเวลาในการออกสู่ตลาด

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.