嗨大家好
我现在有约莫 2000 个 entity,每个 entity 都有自己的 features,例如:
”LeBron”:[”NBA” ,”篮球”,”美国人”]
”电风扇”:[”家电”,”机械”]
...之类
而我的目的是要让 entity 分群,例如 LeBron 就会跟 Westbrook 分成一堆,电风扇就会跟吹风机分成一堆。
目前有两个卡住的点
1.每个 entity 所带的 features 长度不同,可能有些有 5,6 个 features 有些只有一个,这样子是否有方法可以喂给模型?
2.每个 entity 的 features 不尽相同,即使他们表示同一事物,例如 A 球员被标 NBA , B 球员被标 国家篮球协会,我得怎么让模型知道 NBA = 国家篮球协会 这件事?
以上两点,还请不吝告知关键字,让我有个查询方向,谢谢各位。