本发明涉及自动驾驶领域,特别是涉及一种自动驾驶接管的路径规划方法及系统。
背景技术:
运动规划是机器人领域(特别是无人机、自动驾驶车辆)的核心问题,它可以划分为路径规划以及轨迹规划。路径规划通常指的是在空间上规划出位置点,并由位置点形成与时间约束无关的路径。轨迹规划则需要考虑时间约束,例如规划机器人在特定时间经过某位置点,因此轨迹是一种关于时间的路径。
路径规划的方法主要有以下几种类型,分别为:基于图搜索的规划,基于采样的规划,基于函数曲线的规划,基于优化的规划,基于物理模型的规划,以及其他规划方法。
基于图搜索的规划方法能将空间上的复杂结构简化为欧几里得空间中的几何图形,也可将环境简化为由拓扑节点所构成的拓扑地图。机器人可以通过访问图形节点来规划自身的运动路径。常见的图搜索算法是a*算法,它可以得到网络中预设成本最低的节点路线。该类型算法面对节点数多或大面积区域时计算速度缓慢,并不适用于实时路径规划。基于采样的规划方法通常能够随机地对目标区域进行采样,并在节点上生成特定曲线。常见的采样算法是随机搜索树,该算法能够在目标区域内随机地选择节点,并通过节点生成树形分支,基于该树形分支则可进一步产生新的节点。通过这样的路径生成方式,机器人可以对目标区域进行搜索,并最终能够在起始点与目标点之间寻找到连通的路径。该类型算法可以适应复杂的非结构性区域,然而其所生成的路径并不连续。基于函数曲线的规划方法能够通过特定的曲线函数生成路径。常见的算法是五次多项式,使用五次多项式生成路径时,需要对起始点和终点设计约束,通常将机器人相对坐标系或绝对坐标系中的横向及纵向速度与加速度作为约束条件,并通过约束条件来拟合五次多项式的未知参数。该类型算法计算成本低,但并不适合非结构性区域。基于优化的规划方法需要针对实际问题进行建模,对目标指标设计损失函数,并通过对损失函数进行求解从而使损失函数取得局部或全局最优解,进而使路径满足设计指标的要求。该方法适用范围广泛,但其建模难度大,并且对于复杂模型的优化问题求解存在无最优解或无解析解的情况。基于物理模型的规划方法将机器人的运动理解为机器人受到外力作用后自身状态的变化。其中,人工势场法是该规划类型中的一种经典方法。人工势场法主要针对环境中的物体建立势能场,不同物体之间形成斥力或引力。因此,在该方法中默认目标物或目标点上的虚拟物体与机器人自身之间形成能够提供相互吸引作用的引力势能场,而机器人与障碍物之间形成能够提供相互排斥作用的斥力势能场。另一方面,机器人位置点与目标点越远则引力势能场的势能越大,机器人在某障碍物势能场有效范围内且离该障碍物越近则斥力势能场的势能便越大。总势能场是斥力势能场和引力势能场的叠加。同时,在使用该方法时可以规定总势能场正方向的数值为正实数,斥力势能场的势能数值为正实数,引力势场的势能数值为负实数。进一步,通过调整势能场表达式中的参数,可以使机器人自身位置点的势场数值为整个势场的最大值,目标点势场为最小值点。因此,机器人可以沿着总势能场函数的负梯度方向生成势场力并以此引导机器移动,从而形成路径。此外,由于轨迹规划方法众多,故在此不一一枚举。
相比于路径规划,轨迹规划从时序角度描述机器人的运动行为,包含着对机器人从某一个空间点如何移动到另一个空间点的具体描述。例如,要求机器人在某个时刻点通过某个路径点。因此,轨迹规划往往与运动控制紧密结合。这意味着,在轨迹规划的设计工作中需要考虑机器人自身的运动行为约束,例如无人车轨迹规划需要考虑车辆的运动学与动力学约束。通过对比自车当前位置信息与预设的(包含时间约束的)信息做比对,来控制车辆实际的运动状态。因此,轨迹规划也可以基于路径规划的结果,即要求车辆沿着规划好的路径行驶,并控制车辆不断满足时间约束,以实现整车的轨迹规划任务。
接管行为是自动驾驶场景的一个明显特征。以saej3016标准为例,智能车在l3级别会面临非自动驾驶车辆系统失效、自动驾驶系统失效以及超出涉及运行域等情况。在上述三种情况中,自动驾驶系统将无法继续维持有效工作。此时,驾驶员需要重新接触转向系统并进行接管操作。在l4级的自动驾驶场景中,虽然自动驾驶系统不需要驾驶员对系统故障进行监督和纠正,但智能车仍然会面临系统超出设计运行域的情况。因此,在l4阶段中,仍然存在驾驶员重新接触转向系统并进行接管的场景。需要注意的是,针对于l5阶段,即完全自动驾驶,车辆虽然不需要用户进行接管,但这并不意味着用户不能够接管车辆。换而言之,存在汽车生产厂商继续为用户提供接管车辆的人机交互界面的可能性,目的在于满足用户对于手动驾驶的需求和乐趣,并以此提升其产品在市场中的竞争力。因此,即便在完全驾驶阶段,依旧存在车内用户接管车辆的可能性。
另一方面,在未来,车辆运动控制的操纵装置在机械结构与外观造型上均可能会发生变化,即完全不同于目前的转向盘、油门踏板等装置设备,亦可能出现不存在操控装置的情况。然而,这并不能够完全否定触感交互式的运动控制操纵装置在未来仍可能存于人机交互系统中(本专利只讨论触感交互式的转向器)。此外,不论是传统的机械连接式转向系统或是较为先进的线控式转向系统,在接管过程中的转向操纵装置并非始终是静止的。即使转向操纵装置在接管过程中处于静止状态,这并不意味着驾驶员面对接管时的行车状态以及环境做出感知、评估以及操纵行为后会处于一种相对安全的状态。
因此,基于严谨角度考虑,接管风险是始终存在的。驾驶员作为用户在与车辆系统(作为一种自动化系统)发生交互的过程中,两者之间很难实现完美的协同合作,甚至发生接管失败(车辆冲出车道线),继而引发灾难性后果(例如撞击道路设施、进入逆向车道或冲入同向其他车道)。这种驾驶绩效的下降可能由驾驶员对当前行车状态产生了错误或者不合适的情景意识所导致的。不合适的交互反馈会形成驾驶员的认知偏差,进一步引起错误的决策与操作。因此,不合适的信息交互对接管过程所造成的行车危害是不能够被忽视的。显然,这种不合适的信息交互包含触感交互。在接管过程中,车辆通过转向操纵装置向驾驶人传递的触感信息会影响驾驶人对于车辆运动控制的感知和判断。从人因理论出发,不合适的触感反馈可能会诱发驾驶员对车辆系统信任的崩塌,这种信任崩塌会扩散到驾驶员对其他功能完好的车辆子系统的信任度中,进一步引发驾驶员对于更多其他子系统的信任崩塌。显然,这种信任崩溃会影响驾驶员驾驶绩效,增加驾驶风险隐患。其次,当转向盘在接管过程中处于运动状态时,旋转中的转向盘会拉/推动驾驶员上肢,并迫使上肢骨胳形成一定程度的不可控的牵张反射,甚至成为一种强烈刺激,继而引发驾驶员应急应激反应。因此,不合理的触感反馈不仅会增加驾驶员接管难度,也存在诱发驾驶事故的可能性。
目前,针对智能车接管过程的研究尚不充分。多数研究局限于包含接管请求(可视为一种被动接管类型)的驾驶场景中,主要针对驾驶员接管反应时间、接管请求信号类型(包含视觉信号、听觉信号以及触感信号)、非驾驶次任务(阅读、游戏等)、驾驶员人群差异性(青年、老年,男性、女性)等因素对于驾驶员接管反应时间的影响。目前的相关研究没有针对接管过程中的风险进行建模,亦没有基于此的智能车(自动驾驶)路径规划的研究工作。
因此,本发明提出了一种考虑驾驶员接管风险的自动驾驶路径规划方法,通过将驾驶员接管风险(作为一种自身行为风险)与道路环境风险(作为一种外界环境风险)融合,评估包含自身风险与外界风险的统一风险,并在统一风险中规划出最安全的路径,达成了提升包含接管过程在内的行车安全性的目的。
技术实现要素:
本发明的目的是提供一种自动驾驶接管的路径规划方法及系统,将驾驶员接管风险和道路环境风险融合成统一风险,并在统一风险中规划出最安全的路径。
为实现上述目的,本发明提供了如下方案:
一种自动驾驶接管的路径规划方法,所述路径规划方法包括:
获取用户对于车辆的接管认可度;
根据所述接管认可度,确定操作干扰认可度和控制干扰认可度;
根据所述操作干扰认可度和所述控制干扰认可度,确定操作干扰风险和控制风险;
根据所述操作干扰风险和所述控制风险,确定接管风险;
获取周围环境风险;
根据所述接管风险和所述周围环境风险确定自动驾驶车的统一风险;
根据所述统一风险,确定自动驾驶车辆多次风险评估中期望风险强度最低的点的集合,记为最优安全路径;
根据所述最优安全路径控制车辆前轮转角,使自车路径向所述最优安全路径贴合。
可选的,所述接管风险的表达式如下:
其中,rdis表示操作干扰风险,rcon表示控制风险,dlateral表示当前时刻车辆与车道中心的横线偏差,llan表示车道宽度。
可选的,所述周围环境风险包括两方面,分别为除自动驾驶车辆外的外部环境和除驾驶员外的自动驾驶车辆环境。
可选的,所述周围环境风险包含六个层次,第一层的风险要素为周车以及行人的交通行为,第二层的风险要素为车辆子系统,所述车辆子系统为不与车内用户产生直接交互的系统,第三层的风险要素为交通法规,第四层的风险要素为道路设施,第五层的风险要素为道路条件,第六层的风险要素为气候条件。
可选的,所述周围环境风险要素的表达式如下:
rout=∑klirli
其中,rli是第i层的所有风险要素的风险强度,kli是该层的权重因子,rli=∑reij,其中,reij是第i层的第j个风险要素的风险强度。
可选的,所述统一风险的表达式如下:
其中,
可选的,根据所述统一风险,确定自动驾驶车辆多次风险评估中期望风险强度最低的点的集合,记为最优安全路径具体包括:
确定任意时刻自车路径规划点的集合族pc,pc={pc1,pc2,…,pcn};其中集合pc1中的点为以当前自车位置xc为原点并以rm为距离的范式球的边界与道路表面的相交曲线上;
根据集合pc1中的点确定集合pclc;其中,pc1c={xp|||x-xp||=vc}∩{roadsuefacepoints},v是自车车速的绝对值;c是移动范围系数,用于调整观察pclc中元素的选取范围;
在所述第一集合pclc中选取风险强度较低的集合(次优解集)作为pc1,pc1={argmin{rpc1c}±γ},其中γ决定该次优解集的取值范围。
以所述集合pc1作为新的自车位置xc,重复上述步骤获得集合pc2,直到集合族pc中所有的集合都更新完毕,得到最终的自车路径规划点的集合族pc={pc1,pc2,…,pcn};
针对规划的路径点存在不可达的问题,给定任意数值δ和np使得
确定第c1次风险评估结果中次优解集中的每一个点所对应的风险强度
对于共有cn次的风险评估,基于概率论中条件概率和离散随机变量的期望数字特征,数学期望表达式如下:
将不可折返问题设为eventb,因此最优路径为
可选的,所述方法在步骤“根据所述最优安全路径控制车辆前轮转角,使自车路径向所述最优安全路径贴合”之后还包括:
确定路径误差;
基于所述路径误差和所述车辆前轮转角,得到前轮转角变化量;
根据所述前轮转角变化量对车辆进行控制,使车辆不断逼近最优安全路径。
本发明另外提供一种自动驾驶接管的路径规划系统,所述系统包括:
接管认可度获取模块,用于获取用户对于车辆的接管认可度;
操作干扰认可度和控制干扰认可度确定模块,用于根据所述接管认可度,确定操作干扰认可度和控制干扰认可度;
操作干扰风险和控制风险确定模块,用于根据所述操作干扰认可度和所述控制干扰认可度,确定操作干扰风险和控制风险;
接管风险确定模块,用于根据所述操作干扰风险和所述控制风险,确定接管风险;
周围环境风险获取模块,用于获取周围环境风险;
统一风险确定模块,用于根据所述接管风险和所述周围环境风险确定自动驾驶车辆的统一风险;
最优安全路径确定模块,用于根据所述统一风险,确定自动驾驶车辆多次风险评估中期望风险强度最低的点的集合,记为最优安全路径;
控制模块,用于根据所述最优安全路径控制车辆前轮转角,使自车轨迹向所述最优安全路径贴合。
本发明另外提供一种计算机可读存储介质,所述计算机可读介质存储用于设备执行的程序代码,所述程序代码包括如权利要求1-8任一项所述的自动驾驶接管的路径规划方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明中的上述方法更加全面地考虑了自动驾驶车辆(即使在完全自动驾驶阶段)所面临的行车风险要素,即考虑了潜在的接管风险,并在此条件下结合周围环境的风险来规划车辆的最小风险路径,以提升自动驾驶安全性;
弥补了现有接管过程研究中缺少针对接管风险进行模型并应用于智能车运动规划的研究工作。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种自动驾驶接管的路径规划方法流程图;
图2为本发明实施例一种自动驾驶接管的路径规划系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种自动驾驶接管的路径规划方法及系统,将驾驶员接管风险和道路环境风险融合成统一风险,并在统一风险中规划出最安全的路径。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例一种自动驾驶接管的路径规划方法流程图,如图1所示,所述方法包括:
步骤101:获取用户对于车辆的接管认可度。
舒适度识别结果又称为接管认可度,用srta表示,接管认可度包含了用户对于接管过程中的两类信息的认可度,分别为用户对于由车辆运动控制装置所传递的操纵干扰认可度acdis,以及用户在受到操纵干扰后对于自身控制车辆运动能力的认可度,即控制干扰认可度accon。对于单个用户而言,他/她自身能够做出的主观评价为一个有限集合,记为的srta,该集合不会超过(用户自身能够做出的对于操纵干扰的认可度的)有限集合acdis与(用户自身能够做出的对于车辆运动控制认可度的)有限集合accon的笛卡尔积,该笛卡尔积记为:
srta=acdis×accon
步骤102:根据所述接管认可度,确定操作干扰认可度和控制干扰认可度。
操纵干扰认可度acdis的数值越大(主观评价分数越高)代表了用户认为在接管过程中受到的操作干扰(触感交互类型)越大。同时,操作干扰越大意味着对应的接管风险越高,这种类型的风险记为rdis(称为干扰风险)。
控制干扰认可度accon的数值越大或越小(主观评价分数越高或越低)代表了用户在接管过程中对于自身控制车辆运动能力的自我认可的水平越高或越低。自我认可水平越高(自负)或越低(自卑)被视为两种针对自身实际能力的极端判断,从而存在认知偏差。因此,该两种极端情况所对应的风险越大,这种类型的风险记为rcon(称为控制风险);控制风险rcon的最低值对应了用户针对该类认可度的主观评价分数(有限)集合中的元素的中位数。
步骤103:根据所述操作干扰认可度和所述控制干扰认可度,确定操作干扰风险和控制风险。
基于人因工程理论,误操作的产生源自于操纵者自我认知偏差或不适合的情景意识下所形成的错误反馈。然而,上述原因均为主观要素,无法直接测量,因此无法直接用于风险评估。但是,由驾驶员误操作所形成的车辆运动状态反馈可以通过传感器直接观测获得。因此,驾驶员感知性信息的估计值可以通过观测的车辆运动状态反馈数据来获取。估计值共分为两类,分别为干扰风险rdis以及控制风险rcon。进一步,基于集合论知识,风险评估模型存在以下基本的多重映射关系,即:
不可测的主观意图信息集合{i}→主观评价的矫正数值集合{sdis,scon}→矫正数值的估计值集合
进一步可表示为:
f:{i}→{sdis,scon}
j:{rdis,rcon}→{rin}
主观意图信息集合{i}属于不可直接测量的信息,并且受到生物差异性等因素的影响,将其客观地表述为明确的正整数值形式的主观评价结果。基于任何一种数值型主观评价调查问卷评价标尺,它的最大值向量和最小值向量分别为
通过重复独立实验方法并基于上述的矫正计算方法,可以得到用于矫正数值估计的矫正数值集合{sdis,scon}与输入数值集合{dlateral,llan}。其中,dlateral为当前时刻车辆与车道中心线的横线偏差,llan为车道宽度。那么,多元线性回归理性,该估计模型(模型参数辨识前)如下所示:
(sdis,scon)=β(dlateral,llan)
其中,β是该线性回归模型的参数矩阵。
进一步,根据最小二乘法,可得到β的估计量:
那么,最终估计模型为
(sdis,scon)=(((dlateral,llan)t(dlateral,llan))-1(dlateral,llan)t(sdis,scon))(dlateral,llan)
步骤104:根据所述操作干扰风险和所述控制风险,确定接管风险。
通过线性回归模型以及最小二乘法得到矫正数值的估计值集合后,车内用户接管风险rin的计算公式如下:
其中,
步骤105:获取周围环境风险。
周围环境(外部)风险rout包含两个方面,分别为除自动驾驶车辆(自车)外的外部环境以及除驾驶员外的自动驾驶车辆(自车)环境。
周围环境(外部)风险rout存在于一个有效的自动驾驶车辆观察范围r内。在笛卡尔坐标系中,以自动驾驶车辆位置为原点,形成一个范式球(normball),即自动驾驶车辆对于外部环境的有效观察在这个范式球内,可记为
其中,xc为自动驾驶车辆的空间位置(笛卡尔坐标系),r是构成范式球的参数,如果是在一个二维平面上,那么范式球就是一个圆,r就是这个圆的半径,然后xc就是圆心,x是这个圆内的任意一个点。
周围环境(外部)风险rout的风险要素被划分为共有六层的层次(hierarchy)结构,不同层次之间以因果关系进行排序。例如,降雨使路面湿滑,降低了路面附着系数。在这种因果关系中,降雨是“因”,路面附着系数降低是“果”;车辆能够在交通环境中行驶,除了其自身具备行驶能力外,还因为具备道路这个前提条件。道路设施能够被设立,也是因为具备道路这个前提条件。那么,道路的存在性作为“因”,则车辆与道路设置等要素可作为这个“因”的“果”。在本发明中,我们首先考虑“因”的风险,然后再考虑“果”的风险。因此,
最下层(第六层)风险要素与气候条件相关,包括但不限于晴、雨、雾、霾以及风等要素;
次下层(第五层)风险要素与道路条件相关,且与交通设施无关。例如路面附着系数、道路曲率、车道线数量、十字路口以及匝道等要素。
同理,道路条件作为因,对于道路设施的存在以及类型具有一定的影响,例如十字路口或匝道对于道路信息提示设施的需求。此外,当我们考虑了气候、道路条件以及道路设置后,需要注意车辆在交通环境中的通行需要遵守交通法规。因此,交通法规可以作为“因”(以此约束车辆的交通行为),车辆的交通行为可以作为这个“因”的“果”。
中下间层(第四层)风险要素为道路设施,例如红绿灯、隔离带以及车道线标记等要素;
中上层(第三层)风险要素为交通法规,例如车辆在接近人行横道时需要减速等规则。
同理,即便我们考虑了气候、道路条件、道路设施以及交通法规,车辆的行驶不可避免地会受到其自身系统的限制和影响。然而,车辆自身系统作为一个风险要素,它似乎和气候、道路条件、道路设施以及交通法规没有直接的因果关系。但是,在本专利中,上述的四类要素作为一种可以驱动和制约车辆进行行驶的要素,认为其均会对车辆系统因行驶而发生的老化、故障等后果负有一定程度的责任。
那么,次上层(第二层)风险要素为车辆子系统(不与车内用户产生直接交互的系统)。
最后,气候、道路条件、道路设、交通法规以及自车系统实际会对周车以及行人的交通行为产生影响,周车以及行人的交通行为又会对自车驾驶员的行为与决策产生影响,继而影响自车的交通行为。
因此,最上层(第一层)风险要素为周车以及行人的交通行为。
任何风险要素均具有三种风险要素状态(潜在地说明不同层的风险要素均具有对等地位),分别为“危险”状态、“小心”状态以及“安全”状态,分别对应风险强度1·m、0.5·m以及0,其中m存在两种状态,一种状态为m指代了任何一种能够计算风险要素所具备的风险的方法(本发明考虑到与现有风险评估算法进行融合的需求,因此,把任意一种能计算风险要素风险的方法设置为m);另一种性质为m=1,即不考虑与现有风险要素的风险计算方法展开融合。
风险要素所表征的风险强度可由两种方式计算,即通过算子ξ(m1,m2)来选择计算风险要素的风险强度时所采用的模式。其中,m存在两种状态,分别为m1=1以及m1=0;m2∈n。在ξ=(1,m2)时,则假设任何一个风险要素的风险强度共有三种,分别为“危险”状态、“小心”状态以及“安全”状态。每一种状态所对应的风险强度是固定的,分别为1、0.5以及0。那么,结合m1=1,三种状态所对应的风险强度又可表示为1·m1、0.5·m1以及0。换而言之,这种是一种定性的风向强度计算方式。相对地,风险强度存在定量的计算方式。然而,定量计算方法众多,不可枚举。在本专利中,可通过算子ξ融合任何一种现有的风险强度的定量计算方法,其数值计算结果规定为m2值。因此,在ξ=(0,m2)时,任何一个风险要素的风险强度为m2。
任意一个风险要素状态的判断可来自于现有模型(研究)、人为约定(规定)以及相关经验,即针对不同类型的风险要素,可结合行业内相关专业知识或数学模型对该风险要素状态进行判断。
任何风险要素的判断均在由自车观察范围r所形成的范式球内。在这个范式球内,风险要素所提供的风险强度的空间位置与该风险要素的真实空间位置所对应(决定)。
周围环境(外部)风险rout是不同层风险要素所提供的风险强度的叠加,记为
rout=∑klirli
其中,rli是第i层的所有风险要素的风险强度,kli是该层的权重因子。
对于任意一个风险层所提供的风险强度是该层内所有风险要素的风险强度的叠加,记为
rli=∑reij
其中,reij是第i层的第j个风险要素的风险强度。
步骤106:根据所述接管风险和所述周围环境风险确定自动驾驶车辆的统一风险。
任意一时刻,自车的统一风险rdri分别为车内用户接管(内部)风险rin与周围环境(外部)风险rout的线性叠加,记为
其中,
步骤107:根据所述统一风险,确定自动驾驶车辆多次风险评估中期望风险强度最低的点的集合,记为最优安全路径。
在任意时刻,自车的路径规划点的集合族记为pc,可表示为
pc={pc1,pc2,…,pcn}
其中,pcn指的是第n个路径规划点集合,整个集合pc的生成由初始集合pc1开始,新出现的元素(集合)按照角标数字的序列进行排序,并被逐个编入该集合族中。整个规划过程由单次规划结果所组成,不同次的规划对应了数列{c1,c2,…,cn},即第一次规划称为c1,总共有n次规划。
集合pc1中的点为以当前自车位置x为原点并以rm为距离的范式球的边界与道路表面的相交曲线上。同时,规定:
rm=v·c
其中,c为移动范围系数,v为当前车速的标量。那么,可得到一个关于pc1的集合pc1c,记为:
pc1c={xp|||x-xp||=vc}∩{roadsuefacepoints}
需要在集合pc1c中寻找风险强度较低的集合(次优解集),这个点(集合)便是pc1,记为
pc1={argmin{rpc1c}±γ}
其中,{rpc1c}为集合pc1c中每一个元素所具备的风险强度的集合,这里需要注意的是,pc1可能并非单点集,而是多个点的集合。
当pc1非单点集时,该集合内的点可被定义为:
划出pc1后,将pc1作为新的x点(集合),重复上述步骤,获得pc2(此处修改为
对于单个路径,它是单个坐标点的集合,记为
(额外说明:传统人工势场法中的目标点不可达问题除了规划点可能陷入局部极小值点外,也会可能因为在目标点前的斥力势场大于引力势场而使规划点无法达到目标点。常用的解决方案例如对当前规划点提供一个人为扰动,使其跳出局部极小值点。然而,在风险评估工作中,增加人为扰动的行为亦是一种危险行为。因为,人为增加的扰动可能会使规划点跳入风险高的区域,这是不合理的。其次,风险要素所提供的斥力势场对目标点形成了风险屏障,则说明该区域风险较高,车辆理应停止前行,并非需要强行跨越风险聚集区域抵达目标点。在本专利中,若不设置目标点,则车辆的路径规划应该是沿着低风险路径行驶,若当前风险要素所在区域不可跨越时,车辆理应停止前行。)
迭代计算直至路径点出现空间上的“停滞”,(即使规划出的路径点之间距离很小,使车辆在空间中的位置未发生显著变化)即给定任意数值δ与np使得(这里使用集合符号来代替存在的单个位置点)
此时,仅保留pcn作为最终规划结果,即抛弃pcn 1直至pcn np的规划结果。
在整个规划过程中,每一次并非得到最优解集,而是得到次优解集,即风险较小的点,然后再从全部风险评估中选择风险期望最小的路径。因此,对于任何一次评估,次优解集中所有点(元素)的风险强度是不同的,即在第c1次风险评估结果中次优解集中的每一个点所对应的风险强度为:
对于共有cn次的风险评估,基于概率论中条件概率和离散随机变量的期望数字特征。数学期望表达式如下
那么,将考虑不可折返问题设为事件b(eventb),因此最优路径为
步骤108:根据所述最优安全路径控制车辆前轮转角,使自车路径向所述最优安全路径贴合。
步骤109:确定路径误差。
步骤110:基于所述路径误差和所述车辆前轮转角,得到前轮转角变化量。
步骤111:根据所述前轮转角变化量对车辆进行控制,使车辆不断逼近最优安全路径。
在执行器,记为ζ,并重新定义构成这条路径ζ的路径点的有限集合,记为
确定一条最优安全路径,记为ζ,并重新定义构成这条路径ζ的路径点的有限集合,记为
将规划出的最优安全路径迹ζ视为一个期望路径,需要控制前轮转角θ(假设车辆是一辆前轮转向汽车),并使自车路径ξ向最优安全路径迹ζ进行贴合。这里,定义路径误差ε,ε=|ζ-ξ|,每一次误差观测的步长记为t。
我们把规划出的最优安全路径ζ视为一个期望路径,我们需要控制前轮转角θ(假设我们的车辆是一辆前轮转向汽车),并使自车路径ξ向最优安全路径ζ进行贴合。这里,我们定义路径误差ε,每一次误差观测的步长记为t。
在观测到误差ε后,采用pid控制器,将车辆前轮转角作为一个控制量。(在一个步长t内,希望车辆能够根据在这个步长t开始阶段所观察到的误差ε,通过一个pid控制器来得到一个前轮转角变化量δθ,这个前轮转角变化量δθ使车辆在该t内开始逐步减小ε,从而使车辆不断逼近优安全路径ζ,该控制关系式为
δθ=kp·ε ki·∫ε·dt kd·(dε/dt)
其中kp是pid控制器比例项系数,ki是pid控制器积分项系数,kd是pid控制器微分项系数。
在本实施例中,我们考虑一种特殊(极端)情况,即我们假设天气为晴天,道路为单车道的直线道路(坡度为零),路面状态良好,没有道路设施、法规为不允许发生车辆碰撞、车辆系统始终保持正常、无行人,仅在自车(坐标为x)前方有一台车辆(旁车)(坐标为x0)。那么,此时存在:
rl6=0(晴天视为无风险);
rl5=0(路面状态良好视为无风险);
rl4=0(没有道路设施视为无风险);
rl3=0(不可碰撞的法规视为无风险);
rl2=0(车辆系统始终正常视为无风险);
rl1=1·m1(无行人仅存在周车风险)
m选择人工势场法(artificialpotentialfield)。因此,由人工势场法公式得到旁车对于自车所形成的风险强度,记为
rl1=1/2k0r^2(x,x0)
其中,k0是势场系数,r^2(x,x0)为基于自车与旁车坐标的距离函数;
周围环境(外部)风险rout为
rout=∑klirlj=kl1[1/2k0r^2(x,x0)]
根据saej1441标准设计主观评价调查问卷,得到车内用户关于接管过程的主观评价分数,分别为干扰评价srtadis以及控制评价srtacon;
针对干扰评价srtadis以及控制评价srtacon(两种评价类型)构建离线训练数据集,该离线训练数据集用于训练针对其评价结果的预测模型。具体方式为,首先,将不同的主观评价等级(分别针对上述两种评价类型)作为不同的标签。其次,将不同主观评价等级所对应的车速v(自车)与道路曲率ρ数据作为该主观评价等级下的输入数据,以此完成构建(两个,针对不同评价类型)主观评价数据集。
此外,基于已经构建完成的两个主观评价数据集,分别搭建两个神经网络模型(与两个数据集一一对应),使用上述两个数据集并采取误差逆向传播算法完成该两个神经网络模型的离线训练工作,以此得到两个能够基于车速v与道路曲率ρ数据的车内用户接管过程主观评价预测模型;
在自车实际行驶过程中,自动驾驶系统会根据当前车速和道路曲率,结合已经训练好的神经网络模型,对潜在接管过程中的驾驶员主观评价结果进行预测,预测结果为srta,srta包含干扰评价srtadis以及控制评价srtacon;
基于预测出的主观评价结果srtadis,可以设计干扰风险rdis为
rdis=krdissrtadis
其中,krdis为干扰评价修正系数。当引入当前自车位置和周车位置信息后,该公式可以被进一步改写为:
rdis=(krdissrtadis·r^2(x,x0))/2
同理,基于预测出的主观评价结果srtacon,并考虑自车位置和周车位置信息后,干扰风险可以被设计为
rcon=krcon·(1/(1 e^(srtacon-srtacon-mid)))sig(srtacon-srtacon-mid)
其中,krdis为干扰评价修正系数,srtacon-mid为主观评价尺表中的中位数(在使用saej1441时,srtacon-mid=5),当引入当前自车位置和周车位置信息后,该公式可以被进一步改写为
rcon=[krcon·(1/(1 e^(srtacon-srtacon-mid)))sig(srtacon-srtacon-mid)r^2(x,x0)]/2
那么,可以得到(内部)风险rin,
rin=||(krdissrtadis·r^2(x,x0))/2[krcon·(1/(1 e^(srtacon-srtacon-mid)))sig(srtacon-srtacon-mid)r^2(x,x0)]/2||1
可以得到统一风险rdri:
rdri=(krdissrtadis·r^2(x,x0))/2 krin||(krdissrtadis·r^2(x,x0))/2
rcon=krcon·(1/(1 e^(srtacon-srtacon-mid)))sig(srtacon-srtacon-mid)r^2(x,x0)]/2||1
统一风险rdri实际代表了当前观察范围内的风险强度,进一步,我们基于该风险强度结果展开轨路径点生成工作。
最终,我们可以得到一条最优安全路径,记为ζ,并重新定义构成这条路径ζ的路径点的有限集合,记为pζ(p1,…,pm)。同时,定义当前由自车运动所形成的路径,记为ξ。然而,该路径实际是由有限个点所构成,因此我们需要通过使用五次多项式法对该有限集合进行拟合,从而得到连续的路径函数,记为ξc;
我们把规划出的最优安全路径ζ视为一个期望路径,我们需要控制前轮转角θ(假设我们的车辆是一辆前轮转向汽车),并使自车路径ξ向最优安全路径ζ进行贴合。这里,我们定义路径误差ε,每一次误差观测的步长记为t;最后,在观测到误差ε后,我们采用pid控制器,将车辆前轮转角作为一个控制量。(在一个步长t内,我们希望车辆能够根据在这个步长t开始阶段所观察到的误差ε,通过一个pid控制器来得到一个前轮转角变化量δθ,这个前轮转角变化量δθ使车辆在该t内开始逐步减小ε,从而使车辆不断逼近优安全路径ζ,该控制关系式为
δθ=kp·ε ki·∫ε·dt kd·(dε/dt)
其中kp是pid控制器比例项系数,ki是pid控制器积分项系数,kd是pid控制器微分项系数;
基于上述思想和方法,我们实现了在接管过程中,对车内用户主观评价的预测,基于预测结果建立风险评估模型,再根据风险评估模型规划出连续的最优路径,根据最优路径结果控制车辆前轮转角,最终实现基于自动驾驶接管风险的智能车路径规划工作。
图2为本发明实施例一种自动驾驶接管的路径规划系统结构示意图,如图2所示,所述系统包括:
接管认可度获取模块201,用于获取用户对于车辆的接管认可度;
操作干扰认可度和控制干扰认可度确定模块202,用于根据所述接管认可度,确定操作干扰认可度和控制干扰认可度;
操作干扰风险和控制风险确定模块203,用于根据所述操作干扰认可度和所述控制干扰认可度,确定操作干扰风险和控制风险;
接管风险确定模块204,用于根据所述操作干扰风险和所述控制风险,确定接管风险;
周围环境风险获取模块205,用于获取周围环境风险;
统一风险确定模块206,用于根据所述接管风险和所述周围环境风险确定自动驾驶车辆的统一风险;
最优安全路径确定模块207,用于根据所述统一风险,确定自动驾驶车辆多次风险评估中期望风险强度最低的点的集合,记为最优安全路径;
控制模块208,用于根据所述最优安全路径迹控制车辆前轮转角,使自车路径向所述最优安全路径贴合。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
1.一种自动驾驶接管的路径规划方法,其特征在于,所述路径规划方法包括:
获取用户对于车辆的接管认可度;
根据所述接管认可度,确定操作干扰认可度和控制干扰认可度;
根据所述操作干扰认可度和所述控制干扰认可度,确定操作干扰风险和控制风险;
根据所述操作干扰风险和所述控制风险,确定接管风险;
获取周围环境风险;
根据所述接管风险和所述周围环境风险确定自动驾驶车辆的统一风险;
根据所述统一风险,确定自动驾驶车辆多次风险评估中期望风险强度最低的点的集合,记为最优安全路径;
根据所述最优安全路径控制车辆前轮转角,使自车路径向所述最优安全路径贴合。
2.根据权利要求1所述的自动驾驶接管的路径规划方法,其特征在于,所述接管风险的表达式如下:
其中,rdis表示操作干扰风险,rcon表示控制风险,dlateral表示当前时刻车辆与车道中心的横线偏差,llan表示车道宽度。
3.根据权利要求1所述的自动驾驶接管的路径规划方法,其特征在于,所述周围环境风险包括两方面,分别为除自动驾驶车辆外的外部环境和除驾驶员外的自动驾驶车辆环境。
4.根据权利要求1所述的自动驾驶接管的路径规划方法,其特征在于,所述周围环境风险包含六个层次,第一层的风险要素为周车以及行人的交通行为,第二层的风险要素为车辆子系统,所述车辆子系统为不与车内用户产生直接交互的系统,第三层的风险要素为交通法规,第四层的风险要素为道路设施,第五层的风险要素为道路条件,第六层的风险要素为气候条件。
5.根据权利要求1所述的自动驾驶接管的路径规划方法,其特征在于,所述周围环境风险要素的表达式如下:
rout=∑klirli
其中,rli是第i层的所有风险要素的风险强度,kli是该层的权重因子,rli=∑reij,其中,reij是第i层的第j个风险要素的风险强度。
6.根据权利要求1所述的自动驾驶接管的路径规划方法,其特征在于,所述统一风险的表达式如下:
其中,
7.根据权利要求1所述的自动驾驶接管的路径规划方法,其特征在于,根据所述统一风险,确定自动驾驶车辆多次风险评估中期望风险强度最低的点的集合,记为最优安全路径具体包括:
确定任意时刻自车路径规划点的集合族pc,pc={pc1,pc2,…,pcn};其中集合pc1中的点为以当前自车位置x为原点并以rm为距离的范式球的边界与道路表面的相交曲线上;
根据集合pc1中的点确定集合pclc;其中,pc1c={xp|||x-xp||=vc}∩{roadsuefacepoints};
在所述第一集合pclc中选取风险强度最低的集合作为pc1,pc1={argmin{rpc1c}±γ};
以所述集合pc1作为新的自车位置x,重复上述步骤获得pc2,直到集合族pc中所有的集合都更新完毕,得到最终的自车路径规划点的集合族pc={pc1,pc2,…,pcn};
给定任意数值δ和np使得||pcn,pcn np||1<δ,保留pcn作为最终规划结果,抛弃pcn 1直至pcn np的规划结果;
确定第c1次风险评估结果中次优解集中的每一个点所对应的风险强度
对于共有cn次的风险评估,基于概率论中条件概率和离散随机变量的期望数字特征,数学期望表达式如下:
将考虑不可折返问题设为eventb,因此最优路径为
8.根据权利要求1所述的自动驾驶接管的路径规划方法,其特征在于,所述方法在步骤“根据所述最优安全路径迹控制车辆前轮转角,使自车路径向所述最优安全路径贴合”之后还包括:
确定路径误差;
基于所述路径误差和所述车辆前轮转角,得到前轮转角变化量;
根据所述前轮转角变化量对车辆进行控制,使车辆不断逼近最优安全路径。
9.一种自动驾驶接管的路径规划系统,其特征在于,所述系统包括:
接管认可度获取模块,用于获取用户对于车辆的接管认可度;
操作干扰认可度和控制干扰认可度确定模块,用于根据所述接管认可度,确定操作干扰认可度和控制干扰认可度;
操作干扰风险和控制风险确定模块,用于根据所述操作干扰认可度和所述控制干扰认可度,确定操作干扰风险和控制风险;
接管风险确定模块,用于根据所述操作干扰风险和所述控制风险,确定接管风险;
周围环境风险获取模块,用于获取周围环境风险;
统一风险确定模块,用于根据所述接管风险和所述周围环境风险确定自动驾驶车辆的统一风险;
最优安全路径确定模块,用于根据所述统一风险,确定自动驾驶车辆多次风险评估中期望风险强度最低的点的集合,记为最优安全路径;
控制模块,用于根据所述最优安全路径控制车辆前轮转角,使自车路径向所述最优安全路径贴合。
10.一种计算机可读存储介质,其特征在于,所述计算机可读介质存储用于设备执行的程序代码,所述程序代码包括如权利要求1-8任一项所述的自动驾驶接管的路径规划方法。
技术总结