技术问题

人群包创建后,系统什么时候开始处理?

人群包创建好后,DNA将对其实时处理。一般人群包2h左右可处理完成,lookalike人群包需7h左右处理完成。

PLUS的人群包同步几次?

每日1点、12点和17点启动同步任务。

人群包历史版本留存时间是多久?

答:三方问询人群包留存近30个历史版本数据(与天数无关),其他类型人群包仅留存近3个历史版本数据。

人群包失效后是真的删掉吗?

答:人群包失效后,会有7天的窗口期,7天后人群包数据真正删除。

人群包洞察报告和画像历史版本数据留存时间是多久?

答:人群包失效后7天删除人群洞察,自动更新若超过三个版本则会自动删除以前的历史版本。

三方问询接口的技术文档?

三方问询的问询接口API由第三方提供,不同的人群包,不同的业务逻辑使用到的技术文档都不一样。

三方问询的流程是什么?技术逻辑是什么?

当问询发起时,DNA首先将特定人群发至第三方(如支付宝)问询,支付宝会会对其进行验证是否符合要求,然后DNA再次将符合要求的人群发送至支付宝。若有2+次问询,则按照选定的问询频次以及问询时间继续对支付宝进行问询。

DNA的ID类型加密格式是什么?

IDFA采取明文形式;IMEI采用MD5加密。

数据MD5加密工具?

java实现MD5加密方法:
1、java自带jar工具MessageDigest实现
java.security.MessageDigest
2、spring自带的工具DigestUtils实现
org.springframework.util.DigestUtils

人群包需要JD/天猫前验后验怎么办?

前验:广告投放前的数据在京东/天猫的数据验证;
后验:广告投放后在京东/天猫数据校验。
可使用Notepad++对人群包进行文件拆分、编码转换等相关操作。

如何修改下载的人群包文件的编码格式为UTF8?

答案:下载文件编辑器Notepad++,另存为时选择编码格式UTF8.

如何知道下载的人群包文件的行数?

答案:用Excel打开查看行数;对于大文件可以用文件编辑器Notepad++打开查看行数;

下载的人群包文件如果需要打开,修改后缀、编码方式怎么办?

1、用notepad++打开txt或者csv文件,选中文件右键选择Edit with Notepad++打开。
1

2.打开文件左侧是文件行数。
2
3.文件拆分,根据文件大小判断要拆分的文件个数和每个文件保留的行数,从目前文件剪切选中内容,粘贴到另一个txt或者csv文件。
4.打开文件,编码选项显示当前文件编码格式(蓝点选中项)
3
修改编码格式,可以ctrl+A全选文件内容,点击要转的编码项
4

5.字符大小写转换,选中字符串邮件选择转大写或者转小写 5

如果客户需要上传YOYI ftp怎么办?

  1. 下载FileZilla客户端;(下载链接
  2. FTP配置;
  3. 上传文件;
  4. 附:FileZilla使用教程:https://www.yiweihy.com/knowledge/used/215-ftp-filezilla.html

TGI数据源分为哪些类?

答案:分为数盟来源和yoyi来源两类。

引用数盟数据源有哪些方案?

方案一:

  • 剔除数盟中存在的yoyi标签,需要与底层yoyi标签数据关联
    • 数盟数据8亿与底层80亿标签数据关联,时间预估:500core,大概需要40min-60min
  • 基于数盟数据生成gid数据
    • 若关联gid数据:gid数据过大,存在时间性能问题,大概需要30min
    • 若基于gid生成方式,单独生成gid数据同时关联跨屏,大概需要30min

方案二:

  • 数盟数据与生成DNA数据关联,直接生成gid数据
    • 优点:流程简单,时间更短,大约1h
    • 缺点:无法剔除数盟中存在的yoyi标签

TGI计算流程是怎样的?

  1. 建立具有标签来源的统计存储表
  2. 统计数盟数据源的各层级标签数量
  3. 生成一份
  4. 统计人群包中各个层级标签数量
  5. 通过数据源的优先级进行TGI计算,通过高优先级计算的标签不再进入低优先级的标签TGI计算

TGI计算公式?

序号 计算方式 详细指标计算 计算所属范围 描述
1 人群包标签的占比/标签在DNA上的占比 人群包占比=人群包含有该标签的数量/人群中含有该标签所属维度的数量,标签在DNA上的占比=标签的数量/DNA上该标签所属维度的数量 同一个device的同级标签之间不具有互斥性 标签所属维度:指标签所属的大维度,如:媒体偏好、消费偏好等大类
2 人群包标签的占比/标签在DNA上的占比 人群包占比=人群包含有该标签的数量/人群含有该类型标签的数量,标签在DNA上的占比=标签的数量/该类型标签在DNA的总数量 同一个device的同级标签之间具有互斥性 该类型标签:指标签的父级标签,如:男的父级标签(类型标签)是性别

计算样例:

公式1:

标签名 人数
人群包中男 50
人群包中性别 110
DNA中男 414678124
DNA中性别 886391047
人群包中女 40
人群包中性别 110
DNA中女 467503424
DNA中性别 886391047
  • 男的TGI:(50/110)/(414678124/886391047)=97.16
  • 女的TGI:(40/110)/(467503424/886391047)=68.95

公式2:

标签名 人数
人群包中汽车 50
人群包中购物倾向 110
DNA中汽车 109000284
DNA中购物倾向 312732039
人群包中游戏 40
人群包中购物倾向 110
DNA中游戏 88912303
DNA中购物倾向 312732039
  • 汽车的TGI:(50/110)/(109000284/312732039)=130.41
  • 游戏的TGI:(40/110)/(88912303/312732039)=159.87
powered by Gitbook该文件最后修改时间: 2021-04-02 02:55:33

results matching ""

    No results matching ""