运算装置、机器学习方法以及非暂时性存储介质与流程

2021-01-19 14:01:34|

286|

起点商标网

本发明涉及进行用于对移动机械手的动作进行控制的运算的运算装置、机器学习方法以及非暂时性存储介质，该移动机械手进行通过机械手保持多个移动对象物品而向规定的位置移动的作业。

背景技术：

已知通过机械手对对象物品进行保持的机器人。例如日本特开2018-051664中公开了一种将机器人固定于规定的位置并利用机器学习模型来学习用该机械手对在传送带上的规定区域配置的多个物品进行保持的顺序的技术。

然而，日本特开2018-051664中公开的技术以处于将机器人固定于规定的位置的状态为前提，无法应用于具备机械手的机器人本身移动的移动机械手。

技术实现要素：

本发明提供一种能够通过移动机械手来适当地决定对象物品中的在当前的时刻用于移动到规定的位置的最佳的移动对象物品的运算装置。

本发明的第一方案的运算装置进行用于对移动机械手的动作进行控制的运算，所述移动机械手进行通过机械手保持多个对象物品而移动到规定的位置的作业。所述运算装置具备存储部和运算部。存储部存储有通过输入预先取得的多个训练数据集来进行学习的学习完成的机器学习模型，所述训练数据集由状态变量以及与所述状态变量对应的判定数据的组合构成。运算部通过向从所述存储部读出的所述学习完成的机器学习模型输入所述状态变量来输出在当前的时间点应该移动到规定的位置的移动对象物品。所述状态变量包括所述移动机械手的特定部位与所述对象物品的相对位置，与所述状态变量对应的判定数据是所述移动对象物品。

在机器学习模型的状态变量包括移动机械手的特定部位与对象物品的相对位置时，可知以移动机械手的特定部位为基准的各个对象物品的位置关系。由此，能够通过本身的绝对位置变化的移动机械手来适当地决定对象物品中的在当前的时间点用于移动到规定的位置的最佳的移动对象物品。

在上述方案中，所述状态变量可以包括所述移动机械手的特定部位与障碍物的相对位置。即使移动机械手的特定部位与对象物品的相对位置相同，到规定的位置为止的移动容易度也根据在移动机械手与对象物品之间是否存在障碍物而变化。通过在状态变量包括移动机械手的特定部位与障碍物的相对位置，能够更适当地决定在当前的时间点用于移动到规定的位置的最佳的移动对象物品。

在上述方案中，所述移动机械手的特定部位与所述对象物品的相对位置和所述移动机械手的特定部位与障碍物的相对位置可以是在地图上或位图图像上表示的数据。由此，在使机器学习模型学习的过程中，能够将相邻的障碍物集中作为一体物来处理。

在上述方案中，所述移动对象物品的输出可以是在所述地图或位图图像上表示的所述移动对象物品相对于所述移动机械手的特定部位的相对位置数据。由此，能够统一表述输出，因此能够期待进一步提高机器学习模型的学习性能。并且，在输出在地图上或位图图像上表示的移动对象物品相对于移动机械手的特定部位的相对位置数据时，不需要重新确定移动对象物品，因此能够期待到运算量的削减。

在上述方案中，所述状态变量可以包括在路径计划中获得的从所述移动机械手到所述对象物品的路径上的路径长度。即使移动机械手的特定部位与对象物品的相对位置相同，到规定的位置为止的移动容易度也根据从移动机械手到对象物品的路径上的路径长度而变化。通过这样，能够更适当地决定在当前的时间点用于向规定的位置移动的最佳的移动对象物品。

在上述方案中，所述状态变量可以包括从所述对象物品到与该对象物品对应的规定的位置的路径长度。即使移动机械手的特定部位与对象物品的相对位置相同，到规定的位置为止的移动容易度也根据从对象物品到与该对象物品对应的规定的位置的路径长度而变化。通过这样，能够更适当地决定在当前的时间点用于移动到规定的位置的最佳的移动对象物品。

在上述方案中，所述移动机械手的特定部位与所述对象物品以及所述障碍物的相对位置可以包括重力方向的信息。在相对于移动机械手而处于对象物品的跟前的障碍物与该对象物品相比重力方向的长度长的情况下，移动机械手若不向该对象物品与障碍物相比来到跟前的那样的位置移动，则无法对该对象物品进行保持。另一方面，在相对于移动机械手而处于对象物品的跟前的障碍物与该对象物品相比重力方向的长度短的情况下，即使障碍物与该对象物品相比处于跟前，若将该对象物品的重力方向上部设为保持位置，则也能够对该对象物品进行保持。如此，在移动机械手的特定部位与对象物品以及障碍物的相对位置包括重力方向的信息时，能够更适当地决定在当前的时间点用于移动到规定的位置的最佳的移动对象物品。

在上述方案中，所述移动机械手的特定部位与所述对象物品的相对位置可以包括该对象物品的可保持区域的信息。即使移动机械手的特定部位与对象物品的相对位置相同，到规定的位置为止的移动容易度也因对象物品的可保持区域相对于移动机械手的位置是处于正面侧还是处于背面侧而变化。通过移动机械手的特定部位与对象物品的相对位置包括对象物品的可保持区域的信息，能够更适当地决定在当前的时间点用于向规定的位置移动的最佳的移动对象物品。

本发明的第二方案的机器学习方法是用于使计算机如下发挥功能的机器学习模型的机器学习方法：在通过移动机械手具有的机械手保持多个对象物品而移动到规定的位置的作业中输出在当前的时间点应该移动到规定的位置的移动对象物品。所述机器学习方法包括输入多个训练数据集而使所述机器学习模型学习，所述训练数据集由状态变量以及作为判定数据的与所述状态变量对应的在当前的时间点应该移动到规定的位置的移动对象物品的组合构成，所述状态变量包括所述移动机械手的特定部位与所述对象物品的相对位置。据此，能够以在通过移动机械手具有的机械手保持多个对象物品而移动到规定的位置的作业中更适当地决定所述对象物品中的在当前的时间点用于移动到规定的位置的最佳的移动对象物品的方式使机器学习模型学习。

本发明的第三方案的非暂时性存储介质储存能够由一个或多个处理器执行且使所述一个或多个处理器执行以下的功能的命令。所述功能包括：预先取得训练数据集，输入多个所述训练数据集而使机器学习模型学习的步骤，所述训练数据集由状态变量以及作为判定数据的与所述状态变量对应的在当前的时间点应该移动到规定的位置的移动对象物品的组合构成，所述状态变量包括移动机械手的特定部位与对象物品的相对位置，所述移动机械手进行通过机械手保持多个所述对象物品而移动到规定的位置的作业；及通过向学习完成的所述机器学习模型输入所述状态变量来输出所述移动对象物品的步骤。据此，能够在通过移动机械手具有的机械手保持多个对象物品而移动到规定的位置的作业中更适当地决定在当前的时间点用于移动到规定的位置的最佳的移动对象物品。

根据本发明，能够通过移动机械手来适当地决定在当前的时间点用于移动到规定的位置的最佳的移动对象物品。

附图说明

本发明的实施方式的特征、优点、技术及工业意义通过参照附图如下来描述，其中相同的数字表示相同的元件，其中：

图1是应用本实施方式的运算装置的移动机械手的外观立体图。

图2是表示移动机械手的控制结构的框图。

图3是表示运算装置的结构的框图。

图4是对机器学习模型的状态变量进行说明的示意图。

图5是表示优选和移动机械手的特定部位与对象物品的相对位置一起包含于机器学习模型的状态变量中的变量的示意图。

图6是表示优选和移动机械手的特定部位与对象物品的相对位置一起包含于机器学习模型的状态变量中的变量的示意图。

图7是表示优选和移动机械手的特定部位与对象物品的相对位置一起包含于机器学习模型的状态变量中的变量的示意图。

图8是具体地说明通过监督学习来使未学习nn学习整理作业的方法的示意图。

图9是表示学习完成nn的输入、输出的图像的示意图。

图10是表示运算装置的处理的流程的流程图。

图11是表示移动机械手中执行的处理的流程的流程图。

具体实施方式

以下，通过发明的实施方式来对本发明进行说明，但是并不是将要求保护的范围的发明限定于以下的实施方式。并且，实施方式中说明的结构的全部作为用于解决课题的手段不一定是必须的。为了说明的明确化，以下的记载以及附图适当进行省略以及简化。在各附图中，对于相同的要素标注相同的标号，根据需要而省略重复说明。

本实施方式的运算装置在例如家庭内或工厂内进行用于对移动机械手的动作进行控制的运算，该移动机械手进行通过机械手使多个对象物品向规定的位置移动的作业。在此，移动机械手是具备台车等的能够进行移动的结构。并且，通过机械手使多个对象物品向规定的位置移动的作业例如为整理作业。

首先，对应用本实施方式的运算装置的移动机械手的结构进行说明。

图1是应用本实施方式的运算装置的移动机械手100的外观立体图。在图中，xy平面是移动机械手100的行驶面，z轴正方向表示天顶方向。如图1所示，移动机械手100大致分为由作为用于在行驶面上移动的移动机构的台车部110、主体部120和构成机械手150的机器人臂130以及机器人手140构成。

台车部110在圆筒形状的壳体内支承有分别在行驶面上着地的两个驱动轮111和一个脚轮112。两个驱动轮111配设成彼此旋转轴芯一致。通过未图示的电动机来独立地旋转驱动各个驱动轮111。脚轮112是从动轮，设置成从台车部110沿铅垂方向延伸的回转轴从车轮的旋转轴离开并对车轮进行轴支承，以依照台车部110的移动方向的方式追随。例如，若两个驱动轮111沿相同的方向以相同的转速旋转，则移动机械手100直线前进，若两个驱动轮111沿相反的方向以相同的转速旋转，则移动机械手100绕着通过台车部110的两个驱动轮111的中央的铅垂轴回转。

主体部120对机器人臂130进行支承，并且具有构成用户界面的一部分的显示面板123。显示面板123为例如液晶面板，显示角色的面部或者提示与移动机械手100有关的信息。显示面板123在显示面上具有触摸面板，能够接受来自用户的指示输入。

主体部120在能够远望包括机械手150的动作范围在内的前方的环境空间的位置具有环境相机121。环境相机121包括例如作为cmos图像传感器的摄像元件和图像数据生成部，对前方的环境空间进行摄像而输出生成的图像数据。并且，在主体部120中设有控制单元190。控制单元190包括后述的控制部和存储器等。

支承于主体部120的机器人臂130具有多个连杆，例如图示那样具有两个连杆，通过驱动在将各连杆以能够转动的方式连结的关节部131(腕关节、肘关节、肩关节等)设置的促动器而能够获得各种各样的姿势。在各关节部131设有减速机构。在机器人臂130的前端部连接有机器人手140，机器人手140的整体能够通过促动器的驱动而绕着与机器人臂130的前端连杆的延伸方向平行的回转轴回转。机器人手140具备在前端部设置的由促动器驱动的第一指部140a和第二指部140b。第一指部140a和第二指部140b如用虚线表示的那样分别以彼此接近的方式进行动作，通过夹持对象物来实现保持。需要说明的是，由机器人手140进行的对象物品的保持并不限于通过机器人手140的第一指部140a和第二指部140b来把持对象物品的情况，还包括在机器人手140的前端设有吸附机构时通过该吸附机构来进行吸附的情况等。并且，由机器人手140进行的对象物品的保持还包括利用机器人手140并用把持、吸附来进行对象物品的保持的情况。在机器人手140配设有手部相机141。手部相机141包括例如作为cmos图像传感器的摄像元件和图像数据生成部，对机器人手140的前方空间进行摄像而输出生成的图像数据。

图2是表示移动机械手100的控制结构的框图。控制部200为例如cpu，储存于主体部120的控制单元190(参照图1)。驱动轮单元210包括用于对驱动轮111(参照图1)进行驱动的驱动电路、电动机，设于台车部110(参照图1)。

传感器单元220包括在移动中检测障碍物或者检测来自外部的接触的各种传感器，各种传感器分散配置于台车部110以及主体部120(参照图1)。控制部200通过向传感器单元220发送控制信号而驱动各种传感器并取得各种传感器的输出。

环境相机121如上述那样用于观察包括机器人臂130以及机器人手140的动作范围在内的前方的环境空间，按照控制部200的摄像指示来执行摄像。环境相机121将生成的图像数据交给控制部200。手部相机141如上述那样用于观察机器人手140的前方空间，按照控制部200的摄像指示来执行摄像。手部相机141将生成的图像数据交给控制部200。

存储器240是非易失性的存储介质，可使用例如固态驱动器。存储器240除了存储有用于对移动机械手100进行控制的控制程序以外，还存储有用于控制的各种各样的参数值、函数、查找表等。

机器人臂130除了具有使用图1来说明的构造体以外，还具有对各关节部131进行驱动的促动器132、对各关节部131的旋转信息进行检测的旋转传感器134和对各关节部131的操作力(转矩)进行检测的力传感器133。促动器132为例如伺服电动机等。旋转传感器134为例如编码器等。力传感器133为例如对各关节部131的转矩进行检测的转矩传感器等。机器人手140具有对第一指部140a和第二指部140b(参照图1)进行驱动的促动器142、对机器人手140的操作力进行检测的力传感器143。

控制部200通过向驱动轮单元210发送驱动信号来执行驱动轮111的旋转控制。并且，控制部200基于本实施方式的运算装置300的运算结果来对机器人臂130以及机器人手140的动作进行控制。即，控制部200基于本实施方式的运算装置300的运算结果来向机器人臂130的促动器132以及机器人手140的促动器142发送驱动信号。

接着，对本实施方式的运算装置300的结构进行说明。图3是表示运算装置300的结构的框图。如图3所示，运算装置300主要具备取得部310、存储部320和运算部330。

取得部310取得状态变量并交给运算部330。在此，取得部310通过对由环境相机121或手部相机141(参照图2)摄像的作业环境的图像数据进行分析而取得移动机械手100的特定部位与对象物品的相对位置。移动机械手100的特定部位可以是例如重心位置或将机器人手140投影到地面上的位置等通过运算而算出的位置。取得部310包括用于与因特网连接的通信接口。通信接口为例如无线lan单元。

存储部320为例如硬盘驱动器，存储有学习完成的机器学习模型。在此，机器学习模型为例如神经网络(neuralnetwork)。学习完成的机器学习模型(以下记载为“学习完成nn320a”等)是通过输入多个由预先取得的状态变量以及与状态变量对应的判定数据的组合构成的训练数据集来进行学习的。在学习完成nn320a中，关于使机器学习模型学习的具体的方法，后文叙述。存储部320除了存储有学习完成nn320a以外，还存储有运算部330执行的各种软件程序。

运算部330为例如cpu，通过向从存储部320读出的学习完成nn320a输入从取得部310接受的状态变量而输出在当前的时间点应该整理的移动对象物品。

接着，对机器学习模型的状态变量进行说明。需要说明的是，在以下的说明中，也适当参照图3。

图4是对机器学习模型的状态变量进行说明的示意图。在此，在作业环境的地图(map，位置图)e中，对象物品用圆圈表示。机器学习模型的状态变量包括图4中用箭头表示的移动机械手100的特定部位与对象物品(图中用圆圈表示)的相对位置。即，移动机械手100的特定部位p1与对象物品的相对位置是从移动机械手100的特定部位p1到对象物品的矢量。在状态变量包括移动机械手100的特定部位p1与对象物品的相对位置时，可知各个对象物品相对于移动机械手100的特定部位p1的的位置关系。由此，如本实施方式的移动机械手100那样，在由于移动机械手100本身移动而移动机械手100的绝对位置变化的情况下，也能够适当地决定在当前的时间点用于向规定的位置移动的最佳的移动对象物品。

移动机械手100的特定部位与对象物品的相对位置可以包括对象物品的可保持区域的信息。对象物品的可保持区域的信息通过从由环境相机121或手部相机141摄像的作业环境的图像数据中识别对象物品来取得。即使移动机械手100的特定部位与对象物品的相对位置相同，整理容易度也因对象物品的可保持区域相对于移动机械手100的位置是处于正面侧还是处于背面侧而变化。通过移动机械手100的特定部位p1与对象物品的相对位置包括对象物品的可保持区域的信息，能够更适当地决定在当前的时间点用于向规定的位置移动的最佳的移动对象物品。

图5是表示优选和移动机械手100的特定部位与对象物品的相对位置一起包含于机器学习模型的状态变量中的变量的示意图。在此，在作业环境的地图e中，对象物品用圆圈表示，障碍物用由斜线包围的区域表示。需要说明的是，障碍物也可以通过由斜线包围的区域中包含的点云信息来表示。机器学习模型的状态变量优选包括图5中用箭头表示的移动机械手100的特定部位p1与障碍物的相对位置。移动机械手100的特定部位p1与障碍物的相对位置是从移动机械手100的特定部位p1到障碍物的点云的每一个的矢量。即使移动机械手100的特定部位p1与对象物品的相对位置相同，整理容易度也根据在移动机械手100与对象物品之间是否存在障碍物而变化。通过这样，能够更适当地决定在当前的时间点用于向规定的位置移动的最佳的移动对象物品。

移动机械手100的特定部位与对象物品以及障碍物的相对位置可以包括重力方向的信息。即，移动机械手100的特定部位与对象物品以及障碍物的相对位置是三维矢量。在相对于移动机械手100而处于对象物品的跟前的障碍物与该对象物品相比重力方向的长度长的情况下，移动机械手100若不向该对象物品与障碍物相比来到跟前的那样的位置移动，则无法对该对象物品进行保持。另一方面，在相对于移动机械手100而处于对象物品的跟前的障碍物与该对象物品相比重力方向的长度短的情况下，即使障碍物与该对象物品相比处于跟前，若将该对象物品的重力方向上部设为保持位置，则也能够对该对象物品进行保持。通过这样，能够更适当地决定在当前的时间点用于向规定的位置移动的最佳的移动对象物品。

移动机械手100的特定部位与对象物品的相对位置和移动机械手100的特定部位与障碍物的相对位置优选是在地图上或位图图像上表示的数据。如此，能够统一表达在相邻的空间中存在其他的物体或障碍物的状态或者没有物体的状态，统一考虑它们的位置关系并进行学习，学习精度提高。

图6是表示优选和移动机械手100的特定部位与对象物品的相对位置一起包含于机器学习模型的状态变量中的变量的示意图。在此，在作业环境的地图e中，对象物品用圆圈表示，障碍物用由斜线包围的区域表示。机器学习模型的状态变量优选包括图6中用虚线表示的从移动机械手100到对象物品的路径上的路径长度。在此，从移动机械手100到对象物品的路径上的路径长度通过路径计划来获得。在此，路径计划可以使用rrt(rapidly-exploringrandomtree：快速遍历随机树)等公知的方法。即使移动机械手100的特定部位p1与对象物品的相对位置相同，整理容易度也根据从移动机械手100到对象物品的路径上的路径长度而变化。通过这样，能够更适当地决定在当前的时间点用于向规定的位置移动的最佳的移动对象物品。

图7是表示优选和移动机械手100的特定部位与对象物品的相对位置一起包含于机器学习模型的状态变量中的变量的示意图。在此，在作业环境的地图e中，对象物品用圆圈表示，规定的位置即收纳位置用三角标记表示。机器学习模型的状态变量优选包括图7中用虚线表示的从对象物品到与该对象物品对应的收纳位置的路径长度。即使移动机械手100的特定部位p1与对象物品的相对位置相同，整理容易度也根据从对象物品到与该对象物品对应的收纳位置的路径长度而变化。通过这样，能够更适当地决定在当前的时间点用于向规定的位置移动的最佳的移动对象物品。需要说明的是，图7中示出向处于距各个对象物品最近的位置的收纳位置进行收纳的情况，但是也可以为按照每个对象物品来决定向收纳位置c1、c2、c3、c4中的哪个位置进行收纳的情况。

需要说明的是，参照图4～图7来说明的状态变量也可以适当组合。

接着，在学习完成nn320a中，对使机器学习模型学习的具体的方法进行说明。需要说明的是，在以下的说明中，关于移动机械手100的控制结构，适当参照图2，关于运算装置300的结构，适当参照图3。

图8是具体地说明通过监督学习来使未学习nn320b学习整理作业的方法的示意图。在此，使学习前的机器学习模型(以下记载为“未学习nn320b”等)学习整理作业的方法设为监督学习。监督学习是在学习对象的数据中预先决定了正解的情况下，提前大量给与由学习对象的数据(输入)和正解(输出)的组合构成的训练数据集来学习输入与输出之间的关系的方法。

如图8所示，将由作为输入的状态变量161和作为输出的判定数据162的组合构成的训练数据集160给与未学习nn320b。在此，状态变量是上述的包括移动机械手100的特定部位与对象物品的相对位置的变量，判定数据162是在当前的时间点应该整理的移动对象物品。训练数据集160预先取得多个。由此，使未学习nn320b学习整理作业中的状态变量161与判定数据162之间的关系。能够通过增加训练数据集160的取得数n来提高学习完成nn320a的判定精度。

图9是表示学习完成nn320a的输入、输出的图像的示意图。如图9所示，学习完成nn320a通过输入作业环境的地图e中的移动机械手100的特定部位p1与对象物品(图中用圆圈表示)的相对位置(图中用实线箭头表示)而输出在当前的时间点应该整理的移动对象物品(图中用黑圆表示)。需要说明的是，学习完成nn320a也可以与在当前的时间点应该整理的移动对象物品一起输出在当前的时间点可以整理的对象物品(图中用双圆圈表示)、在当前的时间点不整理为好的对象物品(图中用叉号表示)。

在当前的时间点应该移动到规定的位置的移动对象物品的输出优选为在地图上或位图图像上表示的移动对象物品相对于移动机械手100的特定部位的相对位置数据。由此，能够统一表述输出，因此能够期待进一步提高机器学习模型的学习性能。并且，在输出在地图上或位图图像上表示的移动对象物品相对于移动机械手100的特定部位的相对位置数据时，不需要重新确定移动对象物品，因此能够期待运算量的削减。

接着，对运算装置300执行的处理的流程进行说明。图10是表示运算装置300的处理的流程的流程图。如图10所示，首先，取得部310通过对由环境相机121等摄像的作业环境的图像数据进行分析而取得包括移动机械手100的特定部位与对象物品的相对位置的状态变量，将状态变量交给运算部330(步骤s1)。接着，运算部330从存储部320读出学习完成nn320a(步骤s2)。然后，向读出的学习完成nn320a输入取得的状态变量(包括移动机械手100的特定部位与对象物品的相对位置)，输出在当前的时间点应该向规定的位置移动的移动对象物品(步骤s3)。然后，结束一系列的处理。

接着，对移动机械手100中执行的处理的流程进行说明。

图11是表示移动机械手100中执行的处理的流程的流程图。如图11所示，首先使用学习完成nn决定从哪个对象物品向规定的位置移动(步骤s101)。该处理是参照图10来说明的运算装置300中的处理。接着，针对决定的移动对象物品，制作保持计划、路径计划(步骤s102)。保持计划、路径计划可以使用公知的技术。

接着步骤s102，判定保持计划、路径计划中是否已求出解(步骤s103)。在步骤s103中判定为保持计划、路径计划中已求出解的情况下，执行决定的移动对象物品的保持、移动(步骤s104)。在步骤s103中判定为保持计划、路径计划中未求出解的情况下，使处理返回步骤s101。

接着步骤s104，判定是否能够将决定的移动对象物品移动到规定的位置(步骤s105)。在步骤s105中判定为无法将决定的移动对象物品移动到规定的位置的情况下，判定决定的移动对象物品是否从原来的位置移动到不希望的位置(步骤s106)。在步骤s106中判定为决定的移动对象物品没有从原来的位置移动到不希望的位置的情况下，使处理返回步骤s101。在步骤s106中判定为决定的移动对象物品从原来的位置移动到了不希望的位置的情况下，将决定的移动对象物品暂时从移动对象中排除(步骤s107)，使处理返回步骤s101。

在步骤s105中判定为能够将决定的移动对象物品收纳到规定的位置的情况下，将暂时排除的对象物品包含于移动对象中(步骤s108)。接着，判定是否将对象物品全部移动到了规定的位置(步骤s109)。在步骤s109中判定为存在对象物品中的未移动到规定的位置的对象物品的情况下，使处理返回步骤s101。在步骤s109中判定为将对象物品全部移动到了规定的位置的情况下，结束处理。

如以上那样，根据运算装置300，在移动机械手本身移动的情况下，也能够适当地决定在当前的时间点用于向规定的位置移动的最佳的移动对象物品。

需要说明的是，本发明并不限于上述实施方式，能够在不脱离宗旨的范围内适当变更。例如，在上述实施方式中，以通过机械手使多个对象物品向规定的位置移动的作业是整理作业的情况为例进行了说明，但是并不限于此。例如，通过机械手使多个对象物品向规定的位置移动的作业也可以是从一处或多处取出物品并在特定的场所排列的那种准备作业。

在上述实施方式中，将运算装置构成为与机器人分体，但是也可以为将运算装置组装于移动机械手中的结构。

作为上述实施方式的运算装置中使用的机器学习模型，可以使用循环神经网络(rnn：recurrentneuralnetwork)或序列到序列模型(sequence-to-sequencemodel)等处理时间序列数据的机器学习模型。在上述实施方式中，关于使未学习nn学习的方法，说明了利用监督学习来学习通过机械手使多个对象物品向规定的位置移动的作业的例子，但并不限于此。也可以利用例如强化学习等其他的机器学习的方法来实施通过机械手使多个对象物品向规定的位置移动的作业。

上述实施方式中的运算装置实现的各构成要素也能够通过例如使计算机(一个或多个处理器)执行控制程序来实现。更具体而言，在计算机中，能够向主存储装置(未图示)中载入储存于存储部(未图示)的控制程序，通过在主存储装置中执行该控制程序来实现。并且，各构成要素并不限于利用基于程序的软件来实现，也可以通过硬件、固件以及软件中的任一个组合等来实现。

上述的程序可以使用各种各样的类型的非暂时性的计算机可读介质(non-transitorycomputerreadablemedium)来储存并向计算机供给。非暂时性的计算机可读介质包括各种各样的类型的有形存储介质(tangiblestoragemedium)。非暂时性的计算机可读介质的例子包括磁记录介质(例如软盘、磁带、硬盘驱动器)、磁光记录介质(例如磁光盘)、cd-rom(readonlymemory：只读存储器)、cd-r、cd-r/w、半导体存储器(例如掩膜rom、prom(programmablerom：可编程rom)、eprom(erasableprom：可擦除prom)、快闪rom、ram(randomaccessmemory：随机存取存储器))。并且，程序也可以通过各种各样的类型的暂时性的计算机可读介质(transitorycomputerreadablemedium)来向计算机供给。暂时性的计算机可读介质的例子包括电信号、光信号以及电磁波。暂时性的计算机可读介质可以经由电线以及光纤等有线通信路径或无线通信路径将程序向计算机供给。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。