问题标签 [mclust]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
16 浏览

r - R 中的 MClust 包不会在另一台计算机/R 工作室上重现相同的代码

如果您更改 R 版本/计算机,是否有人在 R 中使用 MClust 进行潜在类分析时不会出现相同的类?

我的代码可以在我的笔记本电脑上运行,并且每个样本的每个班级的人数相同,但是当我在另一个版本的 R studio 的另一台服务器上运行相同的代码时,数字会发生变化,即使它们在该服务器中保持不变/ R。

我用:Mclust(LPAdata,G=3, initialization=list(hcPairs=hc(LPAdata, modelNames="EEI")))

set.seed(123) 没有修复同一个 R 工作室中的类数,所以我没有使用它。是否有另一种方法来确保在另一个 R 工作室中的重现性?

0 投票
0 回答
19 浏览

cluster-analysis - Mclust 和 predict.Mclust 产生不同的预测。为什么?

Mclust (5.4.7) 和随后的 predict.Mclust 给出的分类和不确定性有所不同。我不明白为什么?

绘制由 Mclust 计算的不确定性与通过 predict.Mclust 获得的不确定性不相同

0 投票
0 回答
62 浏览

r - 使用 mclust(或其他包)优化高斯混合的聚类并找到最大的聚类

我的问题是我有研究结果,我想找到最大的集群并将其绘制为高斯分布。我用 mclust 和 flexmix 包尝试了不同的东西,但有时最大的集群似乎不正确。所以,我希望这里有人可以帮助我优化我的代码。

对于一个可重现的示例,我使用 rnorm() 创建了数据,因为我无法上传我的数据。

例子:

这是我得到的结果:

在此处输入图像描述

但我想要的更像是这样的:

在此处输入图像描述

这只是一个例子。我知道我创建此示例的方式可能会导致此结果,但我只想说明我的问题。我有几个数据集。有时 mclust 会找到最大的集群,但有时结果有点偏离,就像我的例子一样。我拥有的数据集相似,但高斯分布的形状和大小可能会有所不同。我需要找到一个可用于所有数据集并始终获得满意结果的解决方案。

我喜欢设置 modelNames="V" 因为高斯分布的方差可能会有所不同,如果可能的话,我想设置 G=1:9,因为我知道我的数据有一个大集群,但也有几个较小的集群。

所以我的问题是,我能用这个函数做些什么来保证我总是得到我想要的结果,还是有其他包可以更好地解决我的问题?

我知道最大的集群至少有 70% 的数据。我可以将此作为知识来获得我想要的东西,还是可以使用该模式以某种方式优化我的代码?

任何帮助,将不胜感激。

0 投票
2 回答
43 浏览

r - 如果一个变量“太恒定”,R Mclust(data, G = 1) 会给出奇怪的 Sigma 输出吗?

我正在尝试使用 MClust(, G = 1) 假设单一正态分布的值的 Mu 和协方差。我认为它大部分时间都可以正常工作。但是,如果其中一个变量由重复的常数组成(例如全 0、全 5 等),它会以我不理解的方式影响协方差。

例如,在下面的代码中,引入 D 列会更改 Sigma,以便它们出于某种原因都相等。如果我改变 D 中的一个值,事情就会回到更多的预期值。根据行数,有时需要更改 1 个以上的样本。

这有什么原因或解释吗?我试图更好地理解它,以便在我的变量之一恰好“太恒定”的情况下预测如何避免它。如果它是可预测的,我可能会使用一些逻辑来手动删除变量,分析为单变量并将其放回,等等

测试演示:

使用 3 个典型变量:

输出:

添加“太恒定”变量:

输出:

稍微改变“太恒定”的变量:

输出:

0 投票
0 回答
39 浏览

r - 有人可以演示 Mclust 或 densityMclust 函数的参数初始化的效果吗?

我的问题是我找不到 Mclust 或 densityMclust 函数的参数初始化效果的好例子?我喜欢优化/更改集群的拟合,我希望参数初始化可以成为这样做的一个选项。当我阅读 CRAN 的 Package 'mclust' 指令时,我发现很难理解如何优化高斯混合的拟合。

有人可以通过一个说明效果的示例来演示 hcPairs、子集和噪声的影响并给出简短的解释。如果可能的话,分开来更好地理解。

这是我的代码:

在此处输入图像描述在此处输入图像描述

在这个例子中, densityMclust 函数找到了 5 个簇。有没有一种方法可以使用初始化参数来更改集群,从而只找到两个集群(一个平均约 50 个包含 20350 个数据点,一个平均约 100 个包含 4000 个数据点)?

我知道我的帮助请求很复杂,但我希望有人可以提供一个示例,与 CRAN 的示例相比,这将使参数初始化的使用更清晰,或者只是提供更清晰的解释。如果只能演示一部分(仅 hcPairs、subset 或 noise 的效果),请随意演示。这对我来说仍然是一个很大的帮助。如果我的示例不适合演示,请随意使用您喜欢的任何示例。

非常感谢任何帮助!

0 投票
0 回答
32 浏览

r - Mclust 因小数据集而冻结

我正在尝试在具有 500 个观察值和 2 个变量的数据集上使用 R 包 mclust 中的 Mclust() 函数,并且我想识别 2 个集群。

这应该会相对较快地产生输出,但会冻结在 67%。我在不同的数据集上多次运行这个函数,没有任何问题。如果我只包含直到第 498 行的观察结果,它甚至可以工作,但一旦包含第 499+ 行,它就会失败。

我已经在我的 GitHub 存储库中上传了整个数据集:https ://github.com/fstermann/bthesis/tree/main/MclustFreeze

如果有人知道为什么这个特定的数据集会发生这种情况,我将不胜感激。

0 投票
0 回答
22 浏览

python - 如何根据 GMM (mclust) 给出的概率计算频率分布?

我目前正在尝试使用 GMM 对一维数据执行聚类。这个想法是分开2个群体(k = 2)。尽管我的代码的主要部分是在 Python 中(此处未显示),但我在 R 中使用 mclust,在我的情况下它比 scikit-learn 更适合,因为它会自动调整使用的模型(E 表示等方差,V 表示变方差)。完成后,我想使用 mclust 给出的概率重建每个集群的单独分布,甚至是最初缺失的部分。目的是让频率(而不是密度!)与我的数据单位。现在1我只使用 geom_line 来显示我转换为频率的密度估计值。但我想使用 mclust 给出的概率会更可靠。有谁知道我该怎么做?

这是Python代码:

这是R代码:

And here is a sample of my data: Data 1309009. 7364522. 2899284. 2295116. 1895820. 3399268. 2444428. 3041644. 1579848. 3180522. 2326360. 1857622. 3031202. 3788140. 1677066. 9357568. 1902764. 1725676. 2246494. 1982620. 2315956. 2093726. 2319422. 2128446. 2347204. 2041644. 4517340. 1583320. 2850664. 1690952. 3621504. 1270818. 14319344. 2920112. 1309015. 1774282. 1947898. 1458316. 2420112. 3229124. 4406232. 2211774. 2315946. 3916616. 1645812. 7920120. 6562388. 1427072. 1802066. 2374972. 1329848. 1520818. 2468724. 1444430. 2104144. 2486078. 1569427. 2836768. 1107631. 1666652. 1826368. 1979146. 6979088. 1614570. 1336792. 2656228. 1638868. 1256930. 3017324. 1364572. 2656220. 1979142. 4503456. 1784704. 1256930. 2784688. 1621511. 1572898. 2361088. 1760396. 4805542. 5538134. 2065958. 1847202. 2111084. 1788172. 1895816. 2222204. 3600642. 2017344. 1604150.3086772. 1579848. 2552046. 3868020. 1454850. 1604154. 1784704. 2093728. 2979132. 2607620. 1958314. 1715266. 1531236. 2138862. 1503460. 1739570. 10301952. 1763868. 2604134. 2052060. 1524290. 3604134. 1864572. 4013860. 2545118. 1406234. 2378448. 1947900. 1593728. 6753436. 1489570. 1180542. 1847200. 2680524. 2343728. 2281228. 5489512. 2527766. 1479156. 1746512. 1767342. 1684016. 1993032. 1937482. 2149279. 4357594. 2427062. 5277720. 2534704. 6909656. 1670126. 1638874. 2815958. 2763864. 2222204. 1576376. 2486092. 2253452. 2368032. 2927050. 2840244. 1388878. 5864544. 2565944. 1947902. 2177062. 2190944. 6576288. 2364564. 2249984. 2472196. 1999978. 2683996. 2760388. 2277746. 2263862. 2055534. 4618038. 1322906. 18013708. 2861084. 1309014. 7781192. 4034682. 2708308. 2065950. 2982618. 1170126. 3961756. 1850676. 2524284. 2392328. 2319426. 2374972. 1770812.1663184. 6423486. 1729152. 2013874. 1545121. 1309020. 1993038. 1812476. 3309002. 1913174. 1378462. 1916648. 2243026. 3972192. 1868040. 1506926. 2454836. 1871510. 1534704. 6902688. 2083318. 2045124. 1788178. 2576352. 2364556. 1663174. 3204818. 5524286. 1840264. 1708312. 1708316. 1197906. 1975668. 1583322. 2399286. 2440944. 2850672. 1458320. 1531230. 2309000. 2645790. 1993032. 2611091. 1409706. 5440880. 1708314. 1343740. 1736105. 1593736. 3211782. 1607624. 2416646. 1888866. 1649290. 2920118. 1576374. 2722178. 1475681. 1604154. 1822895. 1499984. 1270821. 1965254. 1336792. 1315960. 1795122. 2336786. 2586790. 2371484. 1583316. 1999976. 1406232. 1576375. 2329836. 2236090. 5100640. 1204848. 1347206. 1760400. 4034686. 5892306. 1163183. 3062456. 1041654. 1437486. 1458318. 1295128. 2239566. 5951310. 1989562. 1208324. 2513856. 1170127. 3065926. 5340224.1878454. 1892346. 3097204. 1531232. 1611096. 1902760. 1635402. 3194410. 2211780. 2562472. 1392350. 1947900. 3166642. 1413176. 1506926. 1315958. 2468722. 1552067. 2659686. 1628456. 2545120. 1697894. 14986064. 2513856. 1749982. 6083250. 1934012. 2097192. 1732624. 5465244. 1531240. 6437426. 1701372. 1340264. 1940960. 1451378. 3020808. 2437466. 2406230. 1989560. 7920058. 2069424. 2673582. 1437490. 1409711. 1614569. 2895808. 1909706. 3874974. 2097198. 3361073. 2041640. 4142311. 4742996. 1746510. 2232624. 3204834. 1795120. 2822884. 1083324. 1840264. 1881924. 3243030. 1885400. 1496508. 3999967. 1552066. 5506864. 3871508. 1114572. 2590252. 2020810. 2263864. 1795118. 2722198. 1947900. 4135392. 1770812. 2840248. 1583312. 4815920. 2437480. 1315960. 1232627. 2180540. 4680476. 2701364. 1732618. 1861088. 2857608. 2270810. 3003442. 1361096. 3138848. 2503448.1597204. 1996512. 1836790. 2531235. 1565954. 3357606. 3722176. 1930544. 5812424. 2052062. 6451302. 1777764. 2305532. 2270808. 1399292. 1791642. 1541650. 6614517. 2704840. 2576358. 1930544. 1878460. 2614552. 1777762. 1222209. 2128458. 2444414. 1538182. 2475680. 1836786. 1767348. 14003322. 6833200. 1489564. 2260394. 4722152. 1951370. 2048594. 1937480. 5149250. 3034692. 2871490. 4885364. 1326374. 2687478. 2374988. 1857622. 3583282. 15524228. 4899261. 2263864. 1524290. 2753444. 4302040. 2256932. 3204816. 1579844. 1729150. 3920092. 3972210. 1618040. 1697898. 1079852. 2402760. 1479150. 2420110. 1586794. 3079814. 5663112. 8614516. 2069420. 3479136. 1413186. 6291614. 3229120. 1114573. 1628456. 2843724. 2336784. 1718734. 1993040. 2246514. 2822886. 1986094. 2600662. 1447894. 1559014. 2062480. 1937484. 3274286. 2645798. 7680458. 3683992. 6104094. 4045116.3166628. 1281236. 2736082. 1618040. 1732622. 1878448. 1725684. 2774258. 3343718. 6329796. 1843734. 1510400. 2513868. 2277752. 3347174. 2027752. 3152732. 3670096. 2298592. 1798588. 2177062. 2423588. 2260392. 2781212. 5076340. 3128434. 1878458. 2156228. 1999984. 2131916. 2743022. 2527756. 2687464. 2552062. 8690938. 2121512. 2263868. 2229144. 2749960. 1965266. 2274285. 1347206. 3406224. 3260390. 1302074. 1579846. 1128464. 2364552. 3069408. 1704852. 2364564. 2222206. 1274290. 1961788. 2031228. 2430528. 1979148. 1607630. 1972206. 1763864. 2086780. 10836576. 1593736. 3183996. 3993036. 1454852. 2569416. 2197892. 2433998. 2746510. 2326368. 3069424. 1951364. 1763876. 6579736. 2135402. 7562472. 1760398. 2187478. 2086799. 2149280. 1479150. 6576328. 3222178. 2263860. 18367843850644. 1812484. 5263844. 1934011. 1954844. 1986100. 3562464. 2378440. 1704846. 2225670. 1812484. 2208312. 2611084. 2354146. 1722200. 2204840. 2024290. 2281230. 1489570. 3399268. 2003456. 5840229. 2124976. 2194432. 1986088. 2156228. 2392341. 2548572. 1899290. 1472212. 1645810. 1642342. 1805540. 5420060. 4437471. 2510392. 1777762. 2322892. 1659708. 1822896. 2111092. 3552060. 1861096. 1249990. 2291644. 3437456. 1687488. 19617736. 2468732. 1489570. 2111096. 3003442. 1260397. 1746510. 1927060. 1437484. 2958319. 1697900. 2159700. 2027750. 1493040. 1993044. 12621450. 1763870. 2048586. 1847200. 1569428. 4156224. 1572904. 1684014. 2479144. 1809002. 2579832. 2659702. 2784704. 1760394. 1402766. 2538172. 2743030. 2583297. 2152754. 1416650. 1409708. 1673596. 5093698. 9367902. 2163176. 1829840. 1628456. 1444430. 2579844. 2541642. 1638878. 3395820. 1506927.1944426. 2850656. 7600670. 1190964. 7083290. 4888844. 2156232. 2937450. 1972206. 2090256. 2461788. 1680536. 5034688. 1809008. 2930522. 2163174. 2989558. 2645808. 4729144. 2027765. 1687480. 10076244. 13506830. 1482626. 2440948. 2347200. 1399298. 2378452. 2256924. 4017320. 1746504. 2222198. 2840248. 1097214. 1878456. 1902762. 1784710. 2152752. 1975676. 1857614. 3461770. 4347184. 1343736. 2017342. 2503446. 2024278. 8600644. 19260212. 1774284. 1972202. 1892347. 1541651. 1204848. 1763871. 2208312. 2777752. 1961784. 2475666. 1989562. 3555512. 1739561. 1843728. 1913180. 2135394. 4013856. 2239564. 1815954. 2065948. 1590264. 1885398. 2392344. 1906226. 3003444. 2930528. 1920114. 5836726. 1819426. 2552052. 1652758. 1430540. 2854134. 4538168. 2982602. 1951370. 1923588. 1579842. 2624954. 2840252. 1749982. 2204834. 3267336. 3763844. 1572902. 3079832. 1604146.2909704. 2329840. 4892312. 4045074. 1958320. 4736060. 3579824. 2159698. 2437468. 2336778. 2430524. 1888868. 2621508. 1711784. 4920094. 3465232. 2267342. 2180532. 2128448. 3895768. 5065914. 2267332. 1857616. 4017316. 2038176. 2857608. 1663172. 6972188. 3055522. 1913178. 3885390. 1802066. 1618036. 2211780. 5131860. 1645816. 1468738. 1895816. 1812482. 5923494. 2024286. 4777732. 1440962. 3104118. 4333290. 3298586. 2357620. 3142332. 2322896. 2597192. 15201120. 2017342. 2232608. 2961772. 11510322. 3024266. 2090250. 2489562. 1663182. 13531168. 10992806. 2690950. 1708318. 2131930. 3618028. 2291638. 1305542. 2302062. 2642330. 1878454. 2371508. 1538176. 1989566. 3284700. 1715264. 2711774. 2256922. 1659702. 3659694. 3385363. 2656223. 2927056. 2343722. 4684004. 2065946. 3607602. 2548578. 1541655. 3798558. 1993044. 5704792. 2298586. 4065942. 5135364. 1784702.1399290. 2666648. 2347195. 1708316. 1704844. 2003456. 1802070. 1895814. 2142336. 6433952. 3604128. 2364554. 1868036. 1736096. 8298520. 2267344. 2211784. 4381896. 1520810. 2232618. 2177058. 2729136. 1878456. 1989562. 3034700. 3819418. 1677068. 2152760. 2569420. 2083322. 7291548. 2722196. 3708296. 2611082. 2975666. 1874976. 2708309. 3138860. 3558992. 2923598. 2100676. 2954822. 1614576. 2447892. 1840260. 1850674. 1701372. 6569392. 11031076. 2805532. 5937440. 1399292. 1909700. 2989548. 1902756. 2076370. 2656220. 1753462. 2902746. 1795120. 1920120. 3499968. 3461768. 2309000. 1597198. 2947896. 1993040. 1388878. 2670106. 2222196. 2527752. 5468732. 2180530. 6138804. 2277750. 1395814. 1930542. 3593708. 1916652. 1902756. 2059008. 3552036. 2524278. 1822896. 1937476. 1895814. 2090248. 1944422. 2444424. 3979116. 1569428. 2635392. 2656228. 2315960. 1795118.2638868. 2635394. 2378460. 1999976. 2753444. 1736088. 2211774. 2312476. 1822900. 2666634. 2993028. 2236086. 1822904. 5663132. 3197878. 3208308. 2385396. 2739564. 4916608. 3489556. 2152750. 2149288. 2593728. 2718716. 1927060. 1708318. 2774272. 2406236. 1993040. 2048590. 2048592. 1715262. 3010380. 2184014. 1277766. 1159708. 2156232. 3774270. 2350672. 1993033. 2531224. 1357622. 1347207. 2534696. 1402758. 1812488. 2756916. 2368036. 13864446. 1510408. 9520660. 1878461. 2895808. 3111076.1357622. 1347207. 2534696. 1402758. 1812488. 2756916. 2368036. 13864446. 1510408. 9520660. 1878461. 2895808. 3111076.1357622. 1347207. 2534696. 1402758. 1812488. 2756916. 2368036. 13864446. 1510408. 9520660. 1878461. 2895808. 3111076.

谢谢是提前。

0 投票
0 回答
23 浏览

r - 在 MClust 中设置集群 ID

当我使用 MClust 对数据集进行聚类时,我使用以下代码 -

当我重复聚类时,每次迭代中的聚类分类(id)可以保持不变,也可以从 1 变为 2 或 2 变为 1。是否可以设置聚类 id,使其不随意改变。我想查看来自 10 个估算数据集的数据有多少次属于集群 1 或集群 2。只有当集群 ID 保持不变时,我才能计算出来。

数据集cc有这个数据

当我聚类时,分类可能是

或者

虽然聚类结果是正确的,但是否可以将其设置为2 1 2 1 1 1每次聚类完成时。

0 投票
0 回答
23 浏览

r - 使用多个估算数据集进行聚类

我使用 MICE 包创建了 10 个多重估算数据集(n = 1600)。我无法使用 MClust 包和with命令运行集群。

如果我跑

显示错误,因为原始数据集有缺失值。

如果我对完整的估算数据集运行相同的命令,我会一次聚类 16000 个值,这是错误的 -

是否可以Mclust使用多个估算数据集运行该命令?

0 投票
0 回答
23 浏览

r - R 中具有用户功能和多种结果的并行处理包

我正在努力使我在 R 中的模型拟合过程更有效。目前,我为 15 个变量生成了 1500 个模拟人生的所有数据。这些数据存储在一个数组中,每个级别是一个 sim,每一行是一个“人”,每一列是 15 个变量之一(例如,300 x 15 x 1500)。mplusObject然后,我多次通过数组的一层,拟合不同的 LPA 模型(一类、二类等)。对于这些模型中的每一个,都有许多结果需要报告和保存。考虑到数据是预先生成的并且数组的一层不依赖于另一层,我已经工作了一段时间,试图弄清楚如何使用并行处理来加快速度。我将在下面显示我目前拥有的内容,但它不起作用,所以我 我想知道我是否需要一个不同的包。谢谢!

我从运行中得到的结果是:

我尝试过使用并行、foreach 和 dopar 以及 parLapply,但无法让它们工作。我得到的最接近的是使用 foreach 函数,但它为每个函数返回一个值,并且没有任何结果保存到结果表中。我可以提供我如何尝试这些的代码,但它们都没有真正起作用,所以在这一点上我质疑它是否可以完成(如果可以,哪种方法/方法最适合这种设置)。

我还应该指出,数据级别可以按任何顺序运行(例如,[,,1], [,,5], [,,3])是可以的,但是一旦该级别被称为完整功能(或者无论如何应该设置)应该运行,因为几个测试将当前模型与该数据集的先前模型(3 类 vs 2 类)进行比较,因此从这个意义上说,数据确实必须按顺序运行。

感谢您提供的任何帮助或建议!