需申請審核

用於無人機避障與導航的深度TD3模型

此模型記錄了無人機藉由強化學習模型TD3在Gazebo虛擬環境中進行導航與避障,並利用NFWPO算法解決DRL常見的零梯度問題。

Actor-network架構如圖所示:

https://imgur.com/a/JANUYzF

輸入:
  1. The lidar ranges(將0−360 degree解析度1度的原始360筆狀態資料降維至0−360 degree解析度36度共10筆,再輸入)
  2. The target position(極座標)2維。
  3. The velocity of UAV measured by IMU (Linear velocity along x, y, and z-axis and angular velocity along z-axis)4維。
  4. 10+2+4共16維
網路架構:

包括3層全連接層(dense),每層由256個hidden layers組成。

輸出:

Action, velocity command (Linear velocity along x, y, and z-axis and angular velocity along z-axis)4維。

Critic-network架構如圖所示:

https://imgur.com/a/75zORS0

輸入部份:

包含the lidar ranges(10D), the target position(2D), the velocity of UAV(4D), the velocity command(4D)。共20維。

網路架構:

包括3層全連接層(dense),每層由256個hidden layers組成。

輸出:

輸出estimated action-value作為critic-loss。

資料與資源

額外的資訊

欄位
作者 劉宗翰
維護者 楊承翰
最後更新 八月 27, 2024, 13:23 (CST)
建立 七月 18, 2024, 18:21 (CST)
DOI 10.30193/scidm-ds-f6k5273

Citation


推薦資料集:


  • 11191-01-04-2 臺中市社會局推展志願服務志工服務成果

    付費方式 免費
    更新頻率 不定期
    描述當年度上下半年本市社會局推展志願服務志工服務成果
  • 嘉義市歷年土地增值稅稅源統計分析表

    付費方式 免費
    更新頻率 不定期
    嘉義市歷年土地增值稅稅源統計分析表
  • 大清國史人物列傳及傳包傳稿資料集四

    付費方式 免費
    更新頻率 不定期
    故宮之大清國史人物列傳及傳包傳稿之文字描述資料
  • 臺北市已核發之廢食用油回收工作證清除機構名單

    付費方式 免費
    更新頻率 不定期
    提供合格廢食用油回收清除機構以便民眾查詢,避免廢食用油流向不明。
  • 綜合所得稅繳納基本稅額單位單項分配20分位申報統計表

    付費方式 免費
    更新頻率 不定期
    綜合所得稅繳納基本稅額單位單項分配20分位申報統計表 單位:%