系统编程( 五 ) _系统编程

BM_SingleLock/threads:3 140 ms 332 ms 3
BM_SingleLock/threads:4 142 ms 405 ms 4
BM_LockStriping_4_Chunks/threads:1 71 ms 69 ms 9
BM_LockStriping_4_Chunks/threads:2 90 ms 178 ms 4
BM_LockStriping_4_Chunks/threads:3 89 ms 248 ms 3
BM_LockStriping_4_Chunks/threads:4 82 ms 299 ms 4
BM_LockStriping_8_Chunks/threads:1 70 ms 69 ms 10
BM_LockStriping_8_Chunks/threads:2 74 ms 143 ms 4
BM_LockStriping_8_Chunks/threads:3 71 ms 198 ms 3
BM_LockStriping_8_Chunks/threads:4 60 ms 200 ms 4同样地，Time代表每个线程的挂钟时间(wall clock time)，CPU代表每个线程使用的CPU时间。另外请注意，由于我的机器只有4个逻辑内核，所以这个测试最多只能运行4个线程，因为超出这个范围的任何线程实际上都不会导致任何额外的争用。
从上面我们可以看到，在单线程的情况下， LockStripedHashSet无论是分块或不分块，挂钟时钟和CPU时间上的表现都比简单的ThreadSafeHashSet稍差。
然而，随着线程数量的增加，对锁的争用增加，LockStripedHashSet在这种情况下性能要好得多。在线程数较高的情况下，将数据拆分成8块优于拆分成4块的情况。
【系统编程】虽然锁定条带化可以帮助减轻对锁的争用，但它的缺点是增加了锁的存储开销。在我们的示例中， 7个额外的锁和额外的absl::flat_hash_set簿记的开销对于我们的基准中的一个实例来说是很小的，但是如果你在一个应用程序中用一个8路条带化的线程安全的hash-set替换所有这些散列集，那么你可能会使其内存使用量大大增加。
结束语
虽然以上还远远不是最常见的系统编程技巧的详尽列表，但希望它能激发你进一步学习的欲望，掌握更多的工具来提高你自己的应用程序的性能，或者至少它能让你更容易地理解为什么性能敏感的代码在做它正在做的事情。
原文：https://paulcavallaro.com/blog/common-systems-programming-optimizations-tricks/
本文为 CSDN 翻译，转载请注明来源出处。
【End】

系统编程( 五 )

相关经验推荐

多边形的对角线与边数的关系多边形的对角线与边数的关系是函数关系吗

11月23日南京秦淮新增1例核酸检测异常人员活动轨迹

要养成健康的饮食和睡眠习惯能提高睡眠质量的食物

非人哉|《斗罗大陆》海神三考，辅助魂技失效，小舞被绑沉银柱溺水

原神怎么获得番茄，原神番茄在哪里收集

胃酸过多想吐怎么缓解如何才能缓解胃酸带来的痛苦呢

怎么防止孩子玩游戏怎么防止孩子玩游戏打人

蜂蜜四五年了还能吃吗

摩尔庄园游戏金矿石怎样获取（摩尔庄园游戏金矿石获取方法）

湖北有哪些城市有地铁湖北有哪些城市

厦门失业生育保险怎么报销厦门失业生育补助金在哪里领取

高通骁龙|华为Mate 50正在测试：搭载4G版骁龙898，明年上半年发布

怎么去除茶垢

呆萌的名字情侣名字设计

女生节幽默祝福话语女生节幽默祝福

小超梦排位撞车圣枪哥，拿手掘墓教做人？峡谷第一实至名归！

dnf手游剑豪带火套怎么样

低血压的危害有哪些

高考前突然什么都不会怎么办如何调整

合肌怎么形成的