问题标签 [social-graph]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Twitter 数据挖掘:分离度
我可以使用什么现成的可用算法来挖掘 twitter 数据,以找出 twitter 上 2 人之间的分离程度。
当社交图谱不断变化和更新时,它会如何变化。
然后,是否有任何我可以使用的 twitter 社交图数据转储,而不是进行如此多的 API 调用来重新开始。
c# - 你如何创建社交图谱?
这对我来说是一个完全陌生的领域。谁能指出我如何创建社交图以及表示它的最佳方式的正确方向?我正在用 C#/asp net 建立一个网站,需要创建一个“朋友”功能......这种类型的东西通常完全存储在数据库中吗?如果是这样,如何?
nosql - 图数据库的区别:Neo4j & AllegroGraph
这两个图数据库有什么区别:Neo4j 和 AllegroGraph?哪个更适合 Java Web 编程?
algorithm - 信任度量和相关算法
我正在尝试更多地了解信任指标(包括相关算法)以及用户投票、排名和评级系统如何连接到严厉的滥用。我已经阅读了描述信任指标的抽象文章和论文,但还没有看到任何实际的实现。我的目标是创建一个系统,允许用户对其他用户和其他用户的内容进行投票,并通过这些投票和相关元数据,确定这些投票是否可以应用于用户级别或受欢迎程度。
您是否在社交图谱中使用或看到过某种信任系统?它是如何工作的,它的优势和劣势是什么?
r - 使用 R 映射博客之间的链接网络?
我想就如何创建和可视化博客之间的链接地图以反映它们之间的“社交网络”的任何建议。
以下是我的想法:
- 从一个(或多个)博客主页开始,收集该页面上的所有链接
- 删除所有内部链接(即如果我从 www.website.com 开始。那么我想从形状“www.website.com/***”中删除所有链接)。但存储所有外部链接。
- 转到每个链接(假设您尚未访问它们),然后重复步骤 1。
- 继续直到(假设)X 从第一页跳转。
- 绘制收集的数据。
我想为了在 R 中做到这一点,人们会使用 RCurl/XML(感谢 Shane 在这里的回答),结合类似igraph
.
但是由于我没有使用其中任何一个的经验,如果我错过了任何重要的步骤,这里是否有人愿意纠正我,或者附上任何有用的代码片段来允许这项任务?
ps:我提出这个问题的动机是,在一周内我将在 userR 2010 上发表关于“博客和 R”的演讲,我认为这可能是一个很好的方式,既可以给观众带来乐趣,也可以激励他们去做像这样的东西自己。
非常感谢!
塔尔
social-networking - Flowtown 和 Rapportive 等网站:它们是如何运作的?
flowtown 和 rapportive 等网站越来越受欢迎。基本上,他们会收到一封电子邮件并返回所有附加的社交媒体网站。他们只是通过 API 从每个单独的站点获取信息(这似乎很费时间为每个站点进行设置)还是还有其他什么?
谢谢
c# - 从 Facebook Graph API 获取个人资料图片的问题
已经打好基础,但现在,发现自己想玩弄我
的应用程序用户的个人资料图片;我被难住了……已经好几个小时了……
首先,我的 oauth_token / access_token 是使用官方的(虽然是 Alpha ;-)
Facebook C# SDK并仅使用Graph API获得的。
FBapi .Get("/" +friend.Dictionary["id"].String + "/picture");
由于未返回 JSONObject 导致异常,并且
使用完整的http://graph.facebook.com/me/picture转发/翻译到图像的 URL。
尝试更直接的方法也没有成功:
WebClient wcImg = new WebClient();
wcImg.DownloadFile("/" +friend.Dictionary["id"].String + "/picture", "name_blame.jpg");
我的问题缺少一些细节;对不起,我很累,如果骚动开始了,稍后再编辑。
想法?
附录: 男孩,我确实受到代码盲症的折磨!然而,你的感性给了我我需要的东西(Zynga,在我的画布上颤抖;-)。
出于好奇......似乎没有可用于个人资料图片的 JSON 模板(请原谅我缺乏术语)?那么如何获得该个人资料图片的充实的 Graph API 照片(如果有)?
php - Redis 和 PHP (Rediska) 在片场相交
我正在尝试使用图形(节点/边)数据集做一些技巧。在这种情况下,一组数据,其中人员 x 跟随人员 y(直接关系)。我想将这些数据(从 mysql 表)加载到 redis 中(让它运行)。我选择使用Rediska是因为我使用 PHP,而且它看起来很稳定。
Rediska 的文档和示例非常有限,所以我希望你们能帮助我。我几乎没有使用 noSQL 的经验,尤其是命名约定 (userid:1:follows = 2?)。
我的问题:
- 如何将一组人 x 跟随人 y 数据加载到 redis 数据集中
- 我如何找到“相交”(SINTER)并最终得到一个 php 数组(所以我让 X 人和 Y 人都跟随(结果集)人))
- 最后不是但很容易,我将如何“遍历”这个图形数据来找到一个关系:人 x -> 人 y -> 人 z(人 x 和人 z 都跟随人 y,因此人 z 在结果集中)
social-networking - 我的网站的交互式网络图?
我的后端有一个 neo4j 数据库,我想在前端以美观和交互的方式向用户显示图形的一个子集。我希望它看起来非常引人注目,接近gephi 的工作方式,因此我需要为这项工作选择合适的技术。想到 Flash 和 Silverlight,但 HTLM5 可能胜任这项工作。Unity 也可能是另一种选择,但这可能会产生巨大的开发成本。
理想情况下,我想使用开箱即用的解决方案,或者定制一个已被证明有效的解决方案。最不理想的选择是自己实现它。
你们能推荐一个适合我的问题的现有解决方案吗?
java - ConcurrentHashMap 的实现和限制
我有一个相当大的项目要完成,我遇到了一些死胡同。我想看看这里的伟大社区是否有任何建议。
我有一个大数据集,我正在尝试构建一个社交图。该数据包含超过 950 万个坐标到 Short 值的映射。对于 ConcurrentHashMap 中的键值,我使用的是字符串,即在其间用 ',' 连接的坐标。
本质上,我正在查找用户之间共有的组数。我有一个非常容易构建的初始哈希图,它将 GroupID 映射到 AvatarID 的向量。这部分运行良好。然后,我有 12 个线程负责他们自己的 GroupID 集和处理(将每个 groupID 中用户之间的计数加 + 1),所有访问都从 ConcurrentHashMap 完成。
在处理了大约 8000 个组后,出现访问问题。一次似乎只有一个线程处于活动状态,我不确定这是因为尺寸过大还是其他因素。这是一个问题,因为我总共需要处理 300,000 个组(并且要及时处理)。
关于我如何实现这一点以及我可以使用的任何快捷方式有什么建议吗?我认为读写同样重要,因为如果值存在(如果不创建它),我必须读取坐标,然后将值加一并写回。
我愿意根据需要提供代码,我只是不知道哪些部分与讨论相关。
谢谢你的时间,-mojavestorm
进一步说明:
两种实现及其限制:
1) 我有一个 HashMap(Integer, Vector(Integer)) preMap,其中包含一个 GroupID 作为键和一个用户 ID 向量。线程在彼此之间拆分 GroupID,并使用返回的每个 Vector(Integer),每个线程根据坐标(即 UserID x 和 UserID y 一起属于(短)n 个组)将一个短值存储到一个 TLongShortHashMap threadMap 中,并且每个线程都拥有自己的线程映射。坐标映射到长值。每个线程完成后,将每个threadMap中对应key的值添加到combinedMap中的同一个key中,这将显示整个系统中有多少组UserID x和UserID y一起属于。
这个实现的问题是线程之间有很高的重叠,所以创建了过多的短值。例如,用户 1 和用户 2 一起属于不同的组。线程 A 和线程 B 负责他们自己的组范围,包括用户 1 和用户 2 所属的组,因此线程 A 和线程 B 都在他们的 threadMap 副本中存储坐标 (1, 2) 的长值和一个短值。如果发生过多重叠,则内存需求可能会很突出。就我而言,我分配给 Java 的所有 46GB 内存都用完了,而且速度也很快。
2)在这个实现中使用相同的preMap,每个线程都被赋予了他们负责的用户坐标范围。每个线程运行,并获取它拥有的每个坐标并遍历 preMap,检查每个 groupID 并查看 UserID x 和 UserID y 是否属于从 preMap 返回的向量。此实现消除了线程映射之间将发生的重叠。
这个问题是时间。目前,该计划正以惊人的速度运行,需要 1400 年才能完成。使用的内存在 4GB 到 15GB 左右波动,但似乎保持“低”。不完全确定它会保持在限制范围内,但是,我想它会。对我来说没有明显的改进。
希望这些描述清楚,有助于深入了解我的问题。谢谢。