技术问题

人群包创建后，系统什么时候开始处理？

人群包创建好后，DNA将对其实时处理。一般人群包2h左右可处理完成，lookalike人群包需7h左右处理完成。

PLUS的人群包同步几次？

每日1点、12点和17点启动同步任务。

人群包历史版本留存时间是多久?

答：三方问询人群包留存近30个历史版本数据（与天数无关），其他类型人群包仅留存近3个历史版本数据。

人群包失效后是真的删掉吗？

答：人群包失效后，会有7天的窗口期，7天后人群包数据真正删除。

人群包洞察报告和画像历史版本数据留存时间是多久？

答：人群包失效后7天删除人群洞察，自动更新若超过三个版本则会自动删除以前的历史版本。

三方问询接口的技术文档？

三方问询的问询接口API由第三方提供，不同的人群包，不同的业务逻辑使用到的技术文档都不一样。

三方问询的流程是什么？技术逻辑是什么？

当问询发起时，DNA首先将特定人群发至第三方（如支付宝）问询，支付宝会会对其进行验证是否符合要求，然后DNA再次将符合要求的人群发送至支付宝。若有2+次问询，则按照选定的问询频次以及问询时间继续对支付宝进行问询。

DNA的ID类型加密格式是什么？

IDFA采取明文形式；IMEI采用MD5加密。

数据MD5加密工具？

java实现MD5加密方法：
1、java自带jar工具MessageDigest实现
java.security.MessageDigest
2、spring自带的工具DigestUtils实现
org.springframework.util.DigestUtils

人群包需要JD/天猫前验后验怎么办？

前验：广告投放前的数据在京东/天猫的数据验证；
后验：广告投放后在京东/天猫数据校验。
可使用Notepad++对人群包进行文件拆分、编码转换等相关操作。

如何修改下载的人群包文件的编码格式为UTF8？

答案:下载文件编辑器Notepad++，另存为时选择编码格式UTF8.

如何知道下载的人群包文件的行数？

答案：用Excel打开查看行数；对于大文件可以用文件编辑器Notepad++打开查看行数；

下载的人群包文件如果需要打开，修改后缀、编码方式怎么办？

1、用notepad++打开txt或者csv文件，选中文件右键选择Edit with Notepad++打开。

2.打开文件左侧是文件行数。

3.文件拆分，根据文件大小判断要拆分的文件个数和每个文件保留的行数，从目前文件剪切选中内容，粘贴到另一个txt或者csv文件。
4.打开文件，编码选项显示当前文件编码格式（蓝点选中项）

修改编码格式，可以ctrl+A全选文件内容，点击要转的编码项

5.字符大小写转换，选中字符串邮件选择转大写或者转小写

如果客户需要上传YOYI ftp怎么办？

下载FileZilla客户端；（下载链接）
FTP配置；
上传文件；
附：FileZilla使用教程：https://www.yiweihy.com/knowledge/used/215-ftp-filezilla.html

TGI数据源分为哪些类？

答案：分为数盟来源和yoyi来源两类。

引用数盟数据源有哪些方案？

方案一：

剔除数盟中存在的yoyi标签，需要与底层yoyi标签数据关联
- 数盟数据8亿与底层80亿标签数据关联，时间预估：500core，大概需要40min-60min
基于数盟数据生成gid数据
- 若关联gid数据：gid数据过大，存在时间性能问题，大概需要30min
- 若基于gid生成方式，单独生成gid数据同时关联跨屏，大概需要30min

方案二：

数盟数据与生成DNA数据关联，直接生成gid数据
- 优点：流程简单，时间更短，大约1h
- 缺点：无法剔除数盟中存在的yoyi标签

TGI计算流程是怎样的？

建立具有标签来源的统计存储表
统计数盟数据源的各层级标签数量
生成一份
统计人群包中各个层级标签数量
通过数据源的优先级进行TGI计算，通过高优先级计算的标签不再进入低优先级的标签TGI计算

TGI计算公式?

序号	计算方式	详细指标计算	计算所属范围	描述
1	人群包标签的占比/标签在DNA上的占比	人群包占比=人群包含有该标签的数量/人群中含有该标签所属维度的数量，标签在DNA上的占比=标签的数量/DNA上该标签所属维度的数量	同一个device的同级标签之间不具有互斥性	标签所属维度：指标签所属的大维度，如：媒体偏好、消费偏好等大类
2	人群包标签的占比/标签在DNA上的占比	人群包占比=人群包含有该标签的数量/人群含有该类型标签的数量，标签在DNA上的占比=标签的数量/该类型标签在DNA的总数量	同一个device的同级标签之间具有互斥性	该类型标签：指标签的父级标签，如：男的父级标签(类型标签)是性别

计算样例:

公式1:

标签名	人数
人群包中男	50
人群包中性别	110
DNA中男	414678124
DNA中性别	886391047
人群包中女	40
人群包中性别	110
DNA中女	467503424
DNA中性别	886391047

男的TGI:(50/110)/(414678124/886391047)=97.16
女的TGI:(40/110)/(467503424/886391047)=68.95

公式2:

标签名	人数
人群包中汽车	50
人群包中购物倾向	110
DNA中汽车	109000284
DNA中购物倾向	312732039
人群包中游戏	40
人群包中购物倾向	110
DNA中游戏	88912303
DNA中购物倾向	312732039

汽车的TGI:(50/110)/(109000284/312732039)=130.41
游戏的TGI:(40/110)/(88912303/312732039)=159.87

技术问题

技术问题

人群包创建后，系统什么时候开始处理？

PLUS的人群包同步几次？

人群包历史版本留存时间是多久?

人群包失效后是真的删掉吗？

人群包洞察报告和画像历史版本数据留存时间是多久？

三方问询接口的技术文档？

三方问询的流程是什么？技术逻辑是什么？

DNA的ID类型加密格式是什么？

数据MD5加密工具？

人群包需要JD/天猫前验后验怎么办？

如何修改下载的人群包文件的编码格式为UTF8？

如何知道下载的人群包文件的行数？

下载的人群包文件如果需要打开，修改后缀、编码方式怎么办？

如果客户需要上传YOYI ftp怎么办？

TGI数据源分为哪些类？

引用数盟数据源有哪些方案？

方案一：

方案二：

TGI计算流程是怎样的？

TGI计算公式?

计算样例:

results matching ""

No results matching ""