-
Notifications
You must be signed in to change notification settings - Fork 33
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
IsolationTree 的入参数据series #33
Comments
你好,感谢你对这个项目的关注。
我猜测可能是负值引起的bug,这是由于在孤立森林中的随机分叉实现中的bug,我已经修复并发布了1.1的版本,您可以尝试使用新的版本,如还有问题请与我联系。
谢谢。
… On Apr 26, 2023, at 11:36, Friend_rrw ***@***.***> wrote:
作者你好,我想请问这个series[],我在使用不同的数据源的时候 会在pathLengthM方法中报空指针异常,这种情况是有些个人数据源没出现,比如我的速度数据源没报错,但温度数据源【带正负值】的会报错,但从数的构建和查询来说应该不是数据源导致的吧。 孤立森林的series[]数据源应该不会有什么限制吧?
最后感谢作者的贡献以及参考,若能耐心回复,将万分感激~[抱拳]
—
Reply to this email directly, view it on GitHub <#33>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/AEWV2CWMYGRFOBSH5BAOP2TXDCJ3XANCNFSM6AAAAAAXL2ZIEE>.
You are receiving this because you are subscribed to this thread.
|
你好,感谢收到你的回复并且修改了有可能的bug代码。 而在我个人对数据源进行分析过程发现:数据源的随机性有可能导致pathLengthM方法内出现空指针报错,如上面我所说的,温度数据它可能一一直保持在一个比较恒定的区间,即极少存在异常值。而反观我的速度数据,大部分都是0值,只有个别或极少部分出现了跳跃速度的情况,然而我的速度数据源能被孤立森林检测出这些异常值,所以我个人怀疑是数据的随机性或者是否均匀分布的数据源,导致算法没有能够找出异常值。其次我这么猜想是因为我的温度数据没有报错,但会一直执行,个人调试过代码应该是在一个do while条件内一直执行的原因。随后我就造出了一个类似于我的速度数据源的集合,并且提出上述的一个猜想,到此再次感谢你对我的陈述。 |
十分感谢你的分析,请问在更新最新的版本之后还会出现问题吗? |
非常感谢你的回复,由于个人也同时再做其它算法方面的研究测试,所以我抽空会重新拉取新版本代码再测试,然后再给你反馈。 |
作者你好 代码结构
|
你好,感谢你提供的测试数据。 空指针的原因是随机森林在构建多颗树的时候,使用的采样的技术,默认的采样值设定为256,所以在处理较长的数组时一旦采样的值不够大就会出现在树中查找值会查找失败。 我已经修复了该问题,在采样值小于数据点数量的时候,默认将其设置成数据点的数量。 修复后的代码已经发布,估计要等2-3个小时生效。请将版本设置成1.1.1使用,谢谢。 |
作者你好,我想请问这个series[],我在使用不同的数据源的时候 会在pathLengthM方法中报空指针异常,这种情况是有些个人数据源没出现,比如我的速度数据源没报错,但温度数据源【带正负值】的会报错,但从数的构建和查询来说应该不是数据源导致的吧。 孤立森林的series[]数据源应该不会有什么限制吧?
最后感谢作者的贡献以及参考,若能耐心回复,将万分感激~[抱拳]
The text was updated successfully, but these errors were encountered: