实际分析投资专业人士
2021年12月13日

丹•Joldzic CFA:自然语言处理大数据的世界

通过

“我们生活在一个大数据世界,没有一个分析师或团队的分析师可以捕获所有的信息在他们的位置。”——丹Joldzic,足协

大数据,人工智能(AI),机器学习,自然语言处理(NLP)。

数年来,我们听到这些技术将如何改变投资管理。他们的线索,研究企业投入的资本,希望将这些趋势转化为增加收入。

然而对我们许多人来说,这些技术和他们所能带来的投资过程仍然隐藏在迷雾之中。,神秘唤起存在担忧:这些发展预示着未来人类的顾问吗?谁将支付一个人做免费技术能做什么?和的风险过度拟合,或者是黑盒效果吗?如果一个应用程序生成α-或失败,我们无法解释为什么,我们也很难帮助我们的公司,我们的客户,或者自己。

然而,尽管有这样的担忧,这些技术的增值已经很明确。人工智能先锋这些创新和利用产生令人印象深刻的成果,特别是当这些技术功能与人类的指导和专业知识。

订阅按钮

记住这一点,我们在仔细想零,细粒度的看一些更引人注目的和成功的迭代AI-driven应用在投资管理。带我们去亚历山大技术和它的NLP的使用。亚历山大一直处于前沿的NLP和机器学习应用在投资行业成立以来通过Ruey-Lung萧,尤金在2012年雪莉。公司的AI-powered NLP技术分析大量的金融它提取到潜在alpha-generating投资数据的文本。

窗口公司的方法和哲学和有关金融技术进步空间更普遍,我们采访了亚历山大的首席执行官丹•Joldzic CFA。

下面是轻轻编辑记录我们的谈话。

爱游戏安全吗CFA协会:首先,不了解它,你会如何定义人工智能和自然语言处理?

丹Joldzic的形象,足协
首席执行官丹•Joldzic CFA,亚历山大技术

丹•Joldzic CFA:自然语言处理(NLP)是文本分类的目标是要从文本中提取信息。文本分类可以通过使用基于规则的方法或人工智能。所以,NLP的人工智能组件是没有必要的。

基于规则的方法基本上是硬编码规则或短语中查找文本。这也被称为字典的方法。例如,如果我想提取句子与收入,我可以寻找“收入”这个词作为一个规则。

使用基于规则的方法,一个词或短语需要由人手动引入字典/研究员。当涉及到人工智能方法,你是谁,在本质上,允许软件创建自己的字典。机器检测单词一起出现在句子组成短语,然后短语出现在同一个句子形式背景。它提供了一个更深的理解文本。

AI / NLP空间有什么吸引你的地方在、特别是亚历山大?

数据分析的只是一个我真正想做的事情。亚历山大之前,我是一个定量研究分析师AllianceBernstein探索数据是我每天的一部分。当它来到NLP,真正令人兴奋的一件事是探索新的类型的数据。文本分类是一种新型的数据集,以前我没有工作,所以有所有这些潜在的可能性我迫不及待地深入。

至于亚历山大,我有幸见见我们的首席科学家,Ruey-Lung萧博士做了令人难以置信的分类在基因组测序工作。如果他可以构建系统分类DNA,我相当肯定我们可以做一个很好的工作分类金融文本。

NLP如何应用通知投资过程?他们应用和在哪里最成功?

我们生活在一个大数据世界,没有一个分析师或团队的分析师可以捕获所有的信息在他们的位置。自然语言处理第一可以帮助通过阅读和分析了大量的文本信息的文档类型,没有分析师团队可以读自己感兴趣的书。捕获这些信息对于公司和标准化文本主题,甚至情绪变得的第一步。下一步是确定如果文本是有价值的。文本转换的数据之后,您可以开始看到来源可以预测未来价格走势,哪些噪音。这允许分析师使用良好的资源来提高性能,并可能降低成本的不良。

瓷砖对t形团队报告

让我们看两个例子:首先,假设你正在运行一个NLP应用程序在财报电话会议。你在找什么?有哪些潜在的红旗或绿旗你希望揭开?

NLP是确定的目标从根本上推动信息。这是不够的一个公司发言人或CEO说,“我们公司是最好的”或者“我们认为我们正在做的事情非常好。“我们关注语句影响一个公司的底线。成本上升吗?他们比预期的上升或多或少吗?是不够看语句隔离。你需要专注于上下文。例如,“我们的季度收入下降了10%,这比我们预期的要好得多。“许多,如果不是大多数,当前NLP系统可能在日晒误解这是消极的词。但它实际上是一个积极的说法,如果一个准确地理解上下文。

同样的问题,但现在NLP是分析一个华尔街Bets-type留言板。你有关注什么?

首先,我们emoji NLP不得不学习一种新的语言。你不遇到火箭飞船和卫星和钻石收益电话。所以emojis需要被纳入我们的NLP的上下文理解。此外,俚语和讽刺在聊天室更普遍。所以你不能使用一个直接的诠释一个给定的单词或短语。但是这里是上下文很重要。

不必命名的名字,可以通过一个例子你走我的亚历山大的NLP是如何应用于一个投资环境和发现隐藏的α?

NLP的真正力量和大数据捕获信息大面板的公司,国家,或商品。所以没有命名特定名称变成了一个非常好的应用程序,在我们不需要从一个先入为主的公司开始探索。我们可以应用NLP类似于标准普尔500家公司和1000家公司的罗素和识别积极趋势在企业的一个子集。我们发现,标准普尔500指数中100家企业积极的声明比该指数每年超过7%。

这只是皮毛。我们使用广泛的投资者,从最突出的投资管理公司和对冲基金世界上小的精品店。我们的客户能够找到α为范围广泛的资产类别在不同交易的视野。无论是短期集中或长期、基本quantamental,或定量,α潜在的是真实的和可衡量的。我们与所有我们的客户工作,确保实现最大改善α和信息比率在他们特定的投资方法。

金融分析师期刊现刊瓷砖

NLP应用在投资已经从显而易见的应用程序中,在获得调用,财务报表等,评估情绪在聊天室和社交媒体。你认为NLP的下一个前沿投资?

它仍然是早期局NLP的应用程序。我们从2012年开始与新闻基于的想法每个人都以某种形式为新闻和使用1%或更少的新闻消费。每天道琼斯出版20000多篇文章,所以很难NLP之前捕获所有的信息。电话和文件是一个必要的扩张,因为深刻理解你的公司从这些文档。我们还有更多的社交媒体。目前,我们主要是针对投资获取聊天室。发生更大的讨论有一个公司的产品和服务,不是投资在这些房间。面板你开始捕捉越大,更多的信息你可以在一个公司,甚至使它之前华尔街的押注。

Tele-text是另一个信息丰富的来源。彭博或CNBC电视节目没有分析价值的信息。小组讨论在一个给定的公司或主题真的有用吗?如果是,我们可以测量。

除此之外,公司内部文本,我们会有很多价值,从电子邮件通信服务电话或聊天。

那人类顾问担心,这些应用程序可能会过时吗?你如何看待这些应用程序替换/补充人力顾问吗?

我们的系统比人工智能自动化的情报。我们试图从领域专家和他们的逻辑应用到更大的信息面板。我们的系统需要分析师和顾问继续识别新的主题和市场的趋势。

和人类的关注使顾问过时了,我们不是自己投资经理或投资的过程。我们作为一个输入和增强客户的各种投资策略。我们不能代替他们做什么。恰恰相反,我们加强他们已经做的事情,帮助他们做得更好从效率的角度看,从风险和回报的角度来看。

简而言之,我们是一个工具来帮助投资专业人士,而不是取代它们。

对于那些感兴趣在这个空间,你有什么建议吗?什么样的人,什么样的技能是成功所需的空间?

我认为这是公平地说,你需要分析,但更重要的是,我发现心理好奇变成了一个大的区别与工程师。有很多方法可以解决一个问题,还有各种开源工具为NLP可以使用。

有工程师可以使用开源工具也没有真正了解他们。他们得到一些数据,正确的分析。工程师我们发现更成功的思考NLP是如何操作的,如何变得更好,直接分析。所以真的需要好奇心和创造力。这不仅仅是一个数学问题。有一些艺术。

广告瓷砖资产管理的人工智能

我没有要求我应该吗?

我认为一个潜在的问题是:人可以使用这些工具?简短的回答是肯定的,但我们仍在早期的采用。起初,NLP和大数据是适合系统的策略,但仍有一些不情愿如何信任这些工具。响应是相当简单的,在我们的工具,允许透明,你可以检查分类的准确性。接下来的问题就变成了,这是怎么工作这么好?有时候很难解释,但我们使用非常精确的分类系统从文本中提取出的见解,往往从基本角度。

但是NLP不仅仅是一个量化的工具。可自由支配的用户可以得到更多有关他们报道的公司或行业,屏幕更大的部门或宇宙,不是他们的信念列表的顶部。一个响应我们不时听到:“你不可能比我更了解一个公司。“我们永远不会要求我们做的,但是一旦你将文本数据,你就可以开始绘制趋势随着时间的推移来帮助决策。早你的问题,我们永远不会取代这些分析师有深入了解,但我们可以利用的工具,知识在更大的规模。

非常感谢,丹。

如果你喜欢这篇文章,别忘了订阅有事业心的投资者


所有文章作者的观点。因此,他们不应该被视为投资建议,也不代表CFA协会的观点表达的观点或作者的雇主。爱游戏安全吗

图片来源:©盖蒂图片社/ Peach_iStock


专业学习CFA协会会员爱游戏安全吗

爱游戏安全吗CFA协会成员有权自行决定和自我报告的专业学习(PL)的学分,包括内容有事业心的投资者。成员可以记录学分容易使用他们在线PL追踪

作者(年代)
保罗麦

保罗·麦卡弗里的编辑有事业心的投资者在CF爱游戏安全吗A协会。此前他担任编辑·威尔逊公司。他的作品发表在财务规划在华尔街等出版物。瓦萨尔学院的硕士研究生,Craig Newmark城市大学新闻学院毕业。

1思想“CFA Dan Joldzic:自然语言处理大数据的世界”

  1. 基地穆罕默德 说:

    保罗,这是一个优秀的文章和贡献。引入NLP和人工智能在投资管理和决策过程会带来巨大的速度、精度、质量和透明度。将显著降低的努力在理解大大小的信息,数据等等。我真是佩服丹Jolzic和亚历山大的创新和科学的方法,并对这一领域的贡献。最好的. .

留下一个回复

你的电子邮件地址将不会被发表。必填字段标记*



通过继续使用本网站,您同意使用cookie。更多的信息

cookie设置在这个网站上设置为“允许饼干”给你最好的浏览体验。如果您继续使用本网站而不改变cookie设置或点击下面的“接受”然后你同意这一点。

关闭