随手记-10.23
dblu - 针对mysql的联合查询的问题
// 改动了122上的/proc/sys/fs/file-max
// mysql 的字符集编码问题(对java)
// 购物搜索的进度说明
// dblu的批量增加
// dblu的搜索结果分组 group by
–
== dblu的总体优化
dblu - 针对mysql的联合查询的问题
// 改动了122上的/proc/sys/fs/file-max
// mysql 的字符集编码问题(对java)
// 购物搜索的进度说明
// dblu的批量增加
// dblu的搜索结果分组 group by
–
== dblu的总体优化
// dblu 提供即时更新的接口
// 有空试用 ecshop2
o 为 discuz 的posts 表(16,100,000条记录,6个字段, 分别是fid tid invisible message subject,其中 message 和 subject 需要全文检索)创建索引的时间 65789064ms => 18.27474 个小时
o 检查分段 rebuild 是否生效
o dblu , 分段索引时,使用的sql语句,要加上 order by [primary key] ,按照 primary key 来分段和排序 ———– (取消)
o 等 posts 表的数据创建完毕,在远程服务器上再做测试修改后的DBLu
o 下午2点,讨论 cbdb 的需求
o 商品搜索项目需要接手,相关的资料需要阅读
o discuz 的 posts表需要索引的字段:
fid tid invisible message subject
o 分段搜索下的返回结果
o 当 按照beginPercent=”90″ 和 endPercent=”100″ 来更新的时候 , db.getIndex 方法取回的 resultSet 为空,需要看代码检查原因。目前怀疑是根据百分比取到的 primary key 的值所在的记录可能不存在
o 调整架构
o 取消对 schedule 中 对 limit 的处理
o 按百分比分段检索
configListFilePath=/var/DBLu/list
dataDirectory=/mnt/ramfs/DBLu/data
/home/zczhong/var/DBLu/f/localhost.wiki.page.xml
threads 表,5个字段(tid, closed, fid, displayorder, subject),其中subject做全文检索,100w条记录,用时39分钟,如果1000w的表,10%就是100w,也差不多是么长的时间
+ 不做太多的分类搜索,比如分开商品、折扣、商店这样的分类来让用户选择性搜索,这样的选择让人迷惑,”选择”可以作为高级功能来提供给用户。不能把“商品”和“折扣”作为分类分开,因为这样选择太多,太麻烦。要求智能,自动计算和猜测用户想搜索什么,想得到的是什么样的搜索结果。建议搜索框只有一个,根据用户在搜索框中输入的内容,猜测用户最想得到的是什么样的结果,根据这个猜想来进行搜索。比如用户输入“手机 折扣”或者“手机 打折”,那么就说明这个用户想搜索的是关于手机打折方面的信息,我们的后台程序对“折扣”这样的典型或者高频的词应该进行优化,目的是让用户搜索到的是折扣类的信息,而不是仅仅包含“折扣”这个词的信息。又例如用户输入“ipod 重庆”,这样用户想搜索的是什么呢?用户想搜的是在重庆卖ipod的商店,而不是仅仅包含“手机”和“重庆”两个关键词的信息。
举一个我前段时间想找买颗小螺丝和小螺丝刀的例子作为过度。前几天我有个数码产品上面的小螺丝掉地上,不知道滚到哪里去了,找不着,怎么办?没有那颗螺丝可不行,盖子盖不好,我想去买一颗。去哪里买?我不知道:( 然后我在家里找有没有其他的东西上有这么小的螺丝,最后在一个废充电器上面发现有,但是螺丝很小,那个孔也很小,我想要个小起子,把那颗螺丝起起来。我也不知道在北京这里哪里能买到小的起子,去电脑城问?太麻烦了,要是在网上能查到我附近哪些商铺有的卖就好了。最后我把充电器砸了才拿到那颗小螺丝,才发现那颗螺丝小了一点,不合适。
+ 不仅仅能对网上商店的搜索。用户进行购物搜索的目的,我自己估计(当然不能代表全部,只是说明我有这样的想法,我也曾问三个朋友,一个技术人员、一个摄影师、一个是家庭主妇),很多时候不是为了在网上的商店上买东西,而是,一、看看关于某种商品的介绍和网友的评论,能找到商品的价格范围,不用担心被骗;二,希望找到自己周围有哪些商店出售这种商品,方便自己去购买,最好能在地图上显示。我相信大部分用户存在这样的需求。
+ 关于一些周边的附加功能,如“相关产品、用户可以在地图上添加某种商品可以在哪些地方买到、积分问题”等。目前我不想考虑,等第二期或者第三期的开发。我觉得目前考虑的重点是商品搜索,尽最大的努力让用户得到他最想得到的结果,这样这个服务才能让更多的用户使用。让用户想买东西的时候,必先用我们的服务,才是第一期的目标。
+ 不推荐这个项目太过着重于价格的比较,因为我觉得单纯的竞价搜索会破坏良性的商业环境。商家的利益受到损害,就不能给用户提供更好的服务。我担心破坏我们和这些网上商城的关系,不方便于以后的合作。或者我们可以利用这点,和网上商城沟通,尽量达成一致来打击其他的竞价搜索引擎。所以这个项目的重点是“导购”,是帮助用户轻松买到他想要的商品。价格的比较只能作为其中的一项服务,并且只适合于网上商城。这个需要进一步权衡利益。
为了满足上面用户的需求,我们的系统应该怎么做?要求聪明、表达清晰、功能强大(绝大部分功能并非面向用户,而是面向我们的聪明程序,聪明的程序主要是负责在猜测用户在想什么,需要得到怎样的结果)
阅读相关的资料后,对前段时间购物搜索项目的想法。
重点:
通过对商品所在商家等级,商品价格,商品评价等的综合考虑来确定某一款性价比最高的商品做为购买对象。
——————– 如果综合考虑?商家等级如何定?商品价格怎样才算合适?商品评价(某个还是某种)?
网店的注册用户数,交易量,交易的成功率,交易的地域范围。
其次:
打折\活动信息如何取得,如何优化?
Powered by WordPress