当一家电力公司想要建造一个新的风电场时,它通常聘请一名顾问在拟建工地进行8至12个月的风速测量。这些测量值与历史数据相关,用于评估场地的发电能力。
在本月晚些时候举行的国际人工智能联合会议上,麻省理工学院的研究人员将提出一种新的统计技术,能够比现有技术产生更好的风速预测-即使它仅使用三个月的数据。这可以节省电力公司的时间和金钱,特别是在海上风电场的评估中,维护测量站的成本特别高。
“我们与风能行业的人们进行了交谈,我们发现他们使用一种非常非常简单的机制来估算现场的风资源,”麻省理工学院计算机科学与人工智能实验室(CSAIL)研究科学家KalyanVeeramachaneni说。)和新论文的第一作者。特别是,Veeramachaneni说,业内的标准做法是假设风速数据遵循所谓的高斯分布-基本统计中熟悉的“钟形曲线”。
“这里的数据是非高斯的;我们都知道,”Veeramachaneni说。“你可以为它设置一个钟形曲线,但这不是数据的准确表示。”
通常情况下,风能顾问会发现拟议地点的风速测量与同一期间在附近气象站进行的风速测量之间的相关性,其中记录可延伸数十年。在这些相关性的基础上,顾问将调整气象站的历史数据,以提供新站点的风速近似值。
相关模型在统计学中称为联合分布。这意味着它不仅代表一个地点的特定测量值的概率,而且代表该测量值与另一个地点的特定测量值的一致性。Veeramachaneni说,风能行业顾问通常将联合分布描述为高斯分布。
不同的曲线
Veeramachaneni与他的同事开发的模型的第一个新颖之处-CSAIL的首席研究科学家Una-MayO'Reilly和马德里ReyJuanCarlos大学的AlfredoCuesta-Infante-它可以将数据考虑在内来自多个气象站。在他们的一些分析中,研究人员使用了来自15个或更多其他站点的数据。
但它的主要优点是它不限于高斯概率分布。此外,它可以使用不同类型的分布来表征来自不同站点的数据,并且可以以不同方式组合它们。它甚至可以使用所谓的非参数分布,其中数据不是通过数学函数描述,而是通过样本集合描述,就像数字音乐文件由连续声波的离散样本组成的方式一样。
该模型的另一个方面是它可以找到数据集之间的非线性相关性。根据一些距离测量,风能行业中常用类型的标准回归分析确定最接近数据点散射的直线。但通常情况下,曲线会提供更好的近似值。研究人员的模型允许这种可能性。
验证
研究人员首先将他们的技术应用于从麻省理工学院博物馆顶部的风速计收集的数据,该博物馆希望在其屋顶上安装风力涡轮机。一旦他们获得了模型准确性的证据,他们就会将其应用于风能行业的一位大型顾问提供给他们的数据。
该公司仅有三个月的特定风电场网站历史数据,Veeramachaneni及其同事能够预测未来两年的风速,与现有模型的风速相比,预测风速为8个月。从那时起,研究人员通过评估计算关节分布的替代方法来改进他们的模型。根据对新文件中报道的科学博物馆数据的进一步分析,他们修改后的方法可能会使预测的准确性翻倍。