ปรับใช้ AI และการเรียนรู้ของเครื่องที่ทรงพลังและมีประสิทธิภาพอย่างรวดเร็วโดยใช้ MCU ของ Renesas RA8M1

By เคนตัน วิลลิสตัน

Contributed By DigiKey's North American Editors

การเพิ่มขึ้นของปัญญาประดิษฐ์ (AI) การเรียนรู้ของเครื่อง (ML) และเวิร์กโหลดที่เน้นการประมวลผลอื่น ๆ ที่ขอบเครือข่ายสำหรับ Internet of Things (IoT) กำลังเพิ่มภาระการประมวลผลเพิ่มเติมให้กับไมโครคอนโทรลเลอร์ (MCU) การจัดการเวิร์กโหลดใหม่เหล่านี้จะเพิ่มการใช้พลังงาน แม้ว่านักออกแบบจะถูกขอให้ลดพลังงานให้เหลือน้อยที่สุดและเร่งเวลาออกสู่ตลาดก็ตาม

นักออกแบบต้องการตัวเลือกการประมวลผลที่ยังคงประสิทธิภาพของ MCU ไว้ ในขณะเดียวกันก็เพิ่มฟีเจอร์ประสิทธิภาพสูงที่ปรับแต่งมาโดยเฉพาะสำหรับกรณีการใช้งานที่ใช้พลังงานต่ำ ตัวเลือกนี้ควรรักษาโมเดลการใช้งานแบบง่ายที่เกี่ยวข้องกับ MCU แบบดั้งเดิม ในขณะที่เพิ่มคุณสมบัติที่เพียงพอเพื่อรองรับแอปพลิเคชันที่ซับซ้อนที่เปิดใช้งานโดย AI และ ML เช่น การควบคุมด้วยเสียง และการบำรุงรักษาเชิงคาดการณ์

บทความนี้กล่าวถึงปัจจัยที่ผลักดันความต้องการ AI และ ML และอธิบายว่าเหตุใดสถาปัตยกรรมโปรเซสเซอร์ใหม่จึงมีความจำเป็นเพื่อมอบความสามารถเหล่านี้อย่างมีประสิทธิภาพ จากนั้นจะแนะนำ RA8M1 แฟมิลี MCU จากRenesas และแสดงให้เห็นว่าสามารถใช้เพื่อตอบสนองข้อกำหนดเหล่านี้ได้อย่างไร

ข้อกำหนดของ Edge AI และ ML

ความต้องการ AI และ ML กำลังเพิ่มขึ้นในการใช้งาน Edge IoT ตั้งแต่ระบบอัตโนมัติในอาคารและอุปกรณ์อุตสาหกรรมไปจนถึงเครื่องใช้ในบ้าน แม้แต่ระบบฝังตัวที่มีขนาดค่อนข้างเล็กและใช้พลังงานต่ำก็ได้รับมอบหมายให้ดูแลปริมาณงานต่าง ๆ เช่น การจำแนกคีย์เวิร์ด การควบคุมคำสั่งเสียง และการประมวลผลเสียง/ภาพ การใช้งานที่เป็นเป้าหมาย ได้แก่ ฮับเซ็นเซอร์ ระบบนำทางและควบคุมด้วยโดรน วัตถุเสมือน (Augmented Reality-AR) ความเป็นจริงเสมือน (Virtual Reality-VR) และอุปกรณ์สื่อสาร

เพื่อลดการใช้พลังงาน ค่าใช้จ่าย และเวลาแฝง ในขณะเดียวกันก็รับประกันความเป็นส่วนตัว การประมวลผลข้อมูลที่ Edge มักนิยมมากกว่าการส่งไปยังระบบคลาวด์ นี่ถือเป็นความท้าทายสำหรับนักออกแบบ เนื่องจากอุปกรณ์ Edge มักมีข้อจำกัดด้านทรัพยากร โดยเฉพาะอย่างยิ่งเมื่อใช้พลังงานจากแบตเตอรี่

MCU ที่ได้รับการปรับปรุงสำหรับการประมวลผลแบบ Edge

โดยทั่วไปปริมาณงาน AI และ ML เกี่ยวข้องกับการดำเนินการทางคณิตศาสตร์เดียวกันซ้ำ ๆ ในชุดข้อมูลขนาดใหญ่ ปริมาณงานเหล่านี้รองรับการเร่งความเร็วโดยใช้คำสั่งเดียว การประมวลผลหลายข้อมูล (SIMD) SIMD ดำเนินการทางคณิตศาสตร์หลายอย่างพร้อมกัน โดยให้ปริมาณงานที่สูงขึ้นมากและประสิทธิภาพการใช้พลังงานที่ดีกว่าการประมวลผลแบบเดิม

เนื่องจาก MCU แบบดั้งเดิมไม่มีฟังก์ชัน SIMD จึงต้องการความช่วยเหลือในการรันเวิร์กโหลด AI และ ML วิธีแก้ปัญหาหนึ่งคือการใช้ตัวประมวลผลสัญญาณดิจิทัล (DSP) หรือตัวเร่งความเร็ว SIMD อื่นๆ ควบคู่ไปกับ MCU อย่างไรก็ตาม วิธีการใช้โปรเซสเซอร์หลายตัวนี้ทำให้การออกแบบระบบมีความซับซ้อน

อีกทางเลือกหนึ่งคือการเปลี่ยนไปใช้ไมโครโปรเซสเซอร์ประสิทธิภาพสูง (MPU) ที่ติดตั้งความสามารถของ SIMD สิ่งนี้สามารถมอบประสิทธิภาพที่จำเป็นในการตั้งค่าโปรเซสเซอร์ตัวเดียว แต่ MPU ก็มีข้อเสียในด้านการใช้พลังงานและชุดคุณสมบัติ ตัวอย่างเช่น ไม่ใช่ทุก MPU ที่ได้รับการออกแบบมาเพื่อมอบการประมวลผลตามที่กำหนดและมีความหน่วงต่ำซึ่งจำเป็นในแอปพลิเคชันที่เน้น MCU

การเปิดใช้งาน AI และ ML ใน MCU

Renesas ตระหนักถึงความจำเป็นในการใช้ชุด MCU ที่ได้รับการปรับปรุงเพื่อรองรับปริมาณงาน AI และ ML จึงได้เปิดตัว MCU ซีรีส์ RA8M1 (รูปที่ 1) ซีรีส์เรื่องนี้มีพื้นฐานมาจาก Arm® สถาปัตยกรรม Cortex®-M85 พร้อมฮีเลียมและ TrustZone และสามารถทำงานได้ที่ 480 เมกะเฮิรตซ์ (MHz) โดยใช้พลังงานโดยทั่วไปที่ 225 ไมโครแอมแปร์ต่อเมกะเฮิรตซ์ (µA/MHz)

แผนผังของ Renesas RA8M1 MCU (คลิกเพื่อดูภาพขยาย)รูปที่ 1: MCU Renesas RA8M1 มีพื้นฐานมาจาก Arm Cortex-M85 และมีเทคโนโลยีฮีเลียมเพื่อเร่งการประมวลผล AI และ ML (แหล่งรูปภาพ: Renesas)

ออกแบบมาเพื่อประสิทธิภาพที่มีประสิทธิภาพและการใช้พลังงานต่ำ MCU RA8M1 มีคุณสมบัติต่าง ๆ เช่น การกำหนด ระยะเวลาการขัดจังหวะที่สั้น และการสนับสนุนการจัดการพลังงานที่ล้ำสมัย โปรเซสเซอร์บรรลุประสิทธิภาพการทำงานที่ 6.39 CoreMark ต่อเมกะเฮิรตซ์ (CoreMark/MHz)

ฮีเลียมคือ SIMD M-Profile Vector Extension (MVE) ที่ช่วยเร่งการประมวลผลสัญญาณและ ML ได้อย่างมาก เพิ่มคำสั่งสเกลาร์และเวกเตอร์ 150 คำสั่ง และเปิดใช้งานการประมวลผลรีจิสเตอร์ 128 บิต (รูปที่ 2) ได้รับการปรับให้เหมาะสมสำหรับไมโครคอนโทรลเลอร์ที่มีทรัพยากรจำกัดและใช้พลังงานต่ำ ตัวอย่างเช่น ฮีเลียมนำรีจิสเตอร์หน่วยจุดลอยตัว (FPU) กลับมาใช้ใหม่ แทนที่จะใช้รีจิสเตอร์ SIMD ใหม่ ซึ่งจะช่วยลดการใช้พลังงานของโปรเซสเซอร์และลดความซับซ้อนในการออกแบบ

แผนภาพของฮีเลียมนำธนาคารทะเบียน FPU มาใช้ซ้ำสำหรับการประมวลผลเวกเตอร์รูปที่ 2: ฮีเลียมนำธนาคารทะเบียน FPU มาใช้ใหม่สำหรับการประมวลผลเวกเตอร์ (แหล่งรูปภาพ: Arm)

ดังที่แสดงในรูปที่ 3 Cortex-M85 ของ RA8M1 มีเทคโนโลยี TrustZone ของ Arm TrustZone ให้การแยกฮาร์ดแวร์สำหรับเฟิร์มแวร์ ทรัพย์สิน และข้อมูลส่วนตัวที่สำคัญ Cortex-M85 ยังเพิ่มความสามารถด้านความปลอดภัยใหม่ เช่น การรับรองความถูกต้องของตัวชี้และส่วนขยายการระบุเป้าหมายสาขา (PACBTI) คุณลักษณะด้านความปลอดภัยเหล่านี้มีคุณค่าอย่างยิ่งในบริบทของ AI ซึ่งอุปกรณ์อาจโต้ตอบกับข้อมูลส่วนบุคคล

รูปภาพ TrustZone ของ Arm Cortex-M85รูปที่ 3: TrustZone ของ Cortex-M85 มีการแยกฮาร์ดแวร์สำหรับเฟิร์มแวร์ ทรัพย์สิน และข้อมูลส่วนตัวที่สำคัญ (แหล่งรูปภาพ: Arm)

คุณสมบัติฮาร์ดแวร์ที่ควรมองหาใน MCU ที่รองรับ AI

MCU ควรรวมประสิทธิภาพที่มีประสิทธิภาพเข้ากับชุดคุณลักษณะที่แข็งแกร่งเพื่อรองรับการใช้งาน AI RA8M1 มีอุปกรณ์ครบครันสำหรับการควบคุมมอเตอร์ การควบคุมลอจิกที่ตั้งโปรแกรมได้ (PLC) การสูบจ่าย และการใช้งานด้านอุตสาหกรรมและ IoT อื่น ๆ

ตัวอย่างเช่น อัลกอริธึม AI ต้องใช้หน่วยความจำจำนวนมาก หน่วยความจำระบบ RA8M1 ประกอบด้วยแฟลชสูงสุด 2 เมกะไบต์ (Mbytes) และ SRAM 1 Mbyte SRAM ประกอบด้วยหน่วยความจำคู่แน่น (TCM) ขนาด 128 กิโลไบต์ (Kbytes) ซึ่งช่วยให้สามารถเข้าถึงหน่วยความจำได้อย่างรวดเร็วสำหรับการคำนวณที่มีประสิทธิภาพสูง

เพื่อให้มั่นใจถึงการทำงานที่เชื่อถือได้ SRAM ผู้ใช้ขนาด 384 Kbytes และ TCM ขนาด 128 Kbytes ทั้งหมดได้รับการกำหนดค่าเป็นหน่วยความจำรหัสแก้ไขข้อผิดพลาด (ECC) คำสั่ง 32 Kbyte และแคชข้อมูล (data caches) ยังได้รับการป้องกัน ECC อีกด้วย

RA8M1 รวมคุณสมบัติความปลอดภัยหลายประการ นอกเหนือจากที่รวมอยู่ใน Arm core ซึ่งรวมถึงกลไกการเข้ารหัสทรัพย์สินทางปัญญาที่ปลอดภัยที่สามารถตั้งโปรแกรมใหม่ได้ (RSIP) สำหรับการประมวลผลข้อมูลที่ปลอดภัย พื้นที่จัดเก็บข้อมูลที่ไม่เปลี่ยนรูปสำหรับการปกป้องข้อมูลที่สำคัญ และกลไกป้องกันการโจรกรรม

สำหรับอินเทอร์เฟซการสื่อสาร MCU มีอีเทอร์เน็ตสำหรับการเชื่อมต่อเครือข่าย, Controller Area Network Flexible Data Rate (CAN FD) สำหรับการใช้งานในยานยนต์และอุตสาหกรรม และ USB ความเร็วสูง/ความเร็วเต็มสำหรับการเชื่อมต่อทั่วไป นอกจากนี้ยังรวมอินเทอร์เฟซของกล้องและอินเทอร์เฟซ Serial Peripheral Interface (SPI) ฐานแปดพร้อมการถอดรหัสได้ทันทีสำหรับหน่วยความจำภายนอก

อินเทอร์เฟซแบบอะนาล็อกประกอบด้วยตัวแปลงอนาล็อกเป็นดิจิตอล (ADC) 12 บิต และตัวแปลงดิจิตอลเป็นอนาล็อก (DAC) ตัวเปรียบเทียบอนาล็อกความเร็วสูง และวงจรตัวอย่างและพักสามวงจร สำหรับการสื่อสารแบบอนุกรม RA8M1 รองรับหลายโปรโตคอล รวมถึงโหมด Serial Communication Interface (SCI) พร้อม SPI, Universal Asynchronous Receiver/Transmitter (UART) และ Inter-Integrated Circuit (I²C) MCU ยังนำเสนอวงจรอินเตอร์อินทิเกรต (I3C) ที่ปรับปรุงแล้วเพื่อเพิ่มอัตราการถ่ายโอนข้อมูลและประสิทธิภาพ

นักพัฒนาที่ต้องการเข้าถึงความสามารถอินพุต/เอาท์พุต (I/O) เหล่านี้อย่างเต็มที่ สามารถใช้แพ็คเกจ Ball Grid Array (BGA) เช่น 224 พิน R7FA8M1AHECBD#UC0 . ผู้ที่มองหาการออกแบบและกระบวนการประกอบแผงวงจรพิมพ์ (บอร์ดพีซี) ที่มีความคล่องตัวมากขึ้นอาจพิจารณาใช้ตัวเลือกแพ็คเกจสี่แบนราบ (LQFP) แบบ low-profile เช่น 144 พิน R7FA8M1AHECFB#AA0 .

สภาพแวดล้อมการพัฒนาสำหรับการใช้งาน AI

นักออกแบบที่สนใจทดลองใช้ซีรีส์ RA8M1 สามารถเริ่มต้นด้วยบอร์ดทดลอง EK-RA8M1 R7FA8M (รูปที่ 4) บอร์ดนี้ประกอบด้วยอินเทอร์เฟซอีเทอร์เน็ต RJ45 RMII, อินเทอร์เฟซโฮสต์และอุปกรณ์ USB ความเร็วสูง และส่วนหัว CAN FD สามพิน สำหรับหน่วยความจำ มีแฟลช SPI ฐานแปดขนาด 64 Mbytes

รูปภาพของบอร์ดทดลองRenesas EK-RA8M1 (คลิกเพื่อดูภาพขยาย)รูปที่ 4: บอร์ดทดลอง EK-RA8M1 รองรับ I/O ที่แข็งแกร่งเพื่อใช้ RA8M1 MCU (แหล่งรูปภาพ: Renesas)

RA8M1 ได้รับการสนับสนุนโดย Renesas Flexible Software Package (FSP) ซึ่งเป็นเฟรมเวิร์กที่ครอบคลุมซึ่งออกแบบมาเพื่อมอบฐานซอฟต์แวร์คุณภาพสูงที่ใช้งานง่าย ปรับขนาดได้ และมีคุณภาพสูงสำหรับการออกแบบระบบฝังตัว

แพ็คเกจนี้มีเครื่องมือในการพัฒนารวมถึง e² studio สภาพแวดล้อมการพัฒนาแบบรวม (IDE) ที่ใช้ Eclipse IDE ยอดนิยม นอกจากนี้ยังมีระบบปฏิบัติการแบบเรียลไทม์ที่โดดเด่นและไร้ค่าลิขสิทธิ์อีก 2 ระบบ ได้แก่ Azure RTOS และ FreeRTOS

แพคเกจนี้ประกอบด้วยไดรเวอร์น้ำหนักเบาและพร้อมใช้งานจริง ซึ่งรองรับกรณีการใช้งานทั่วไปในระบบฝังตัว เมื่อใช้ร่วมกับบอร์ดทดลอง ไดรเวอร์เหล่านี้จะช่วยให้นักพัฒนามีเส้นทางที่รวดเร็วในการทดลองกับ RA8M1 I/O

สรุป

RA8M1 ช่วยให้นักพัฒนามีทางเลือกใหม่ในการใช้งานเวิร์กโหลด AI และ ML ในการใช้งาน Edge IoT ซึ่งช่วยประหยัดพลังงาน เพิ่มประสิทธิภาพ ลดความซับซ้อน และลดระยะเวลาในการออกสู่ตลาด

DigiKey logo

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

About this author

Image of Kenton Williston

เคนตัน วิลลิสตัน

เคนตัน วิลลิสตัน สำเร็จการศึกษาระดับปริญญาตรีสาขาวิศวกรรมไฟฟ้าในปี 2000 และเริ่มอาชีพของเขาในฐานะนักวิเคราะห์เกณฑ์มาตรฐานโปรเซสเซอร์ ตั้งแต่นั้นมา เขาทำงานเป็นบรรณาธิการของกลุ่ม EE Times และช่วยเปิดตัวและเป็นผู้นำสิ่งพิมพ์และการประชุมหลายรายการที่เกี่ยวข้องกับอุตสาหกรรมอิเล็กทรอนิกส์

About this publisher

DigiKey's North American Editors